Bằng sáng chế đáng sợ của Microsoft sẽ cho phép Windows xem mọi thứ bạn làm, gửi nó đến Bing, để có kết quả tìm kiếm tốt hơn

Biểu tượng thời gian đọc 6 phút đọc


Bạn đọc giúp đỡ ủng hộ MSpoweruser. Chúng tôi có thể nhận được hoa hồng nếu bạn mua thông qua các liên kết của chúng tôi. Biểu tượng chú giải công cụ

Đọc trang tiết lộ của chúng tôi để tìm hiểu cách bạn có thể giúp MSPoweruser duy trì nhóm biên tập Tìm hiểu thêm

đáng sợ-cortana

Duyệt qua thư viện bằng sáng chế của Microsoft, chúng tôi thường bắt gặp những ý tưởng mà chúng tôi mong muốn họ thực hiện, nhưng chưa bao giờ thành sản phẩm.

Hôm nay chúng ta gặp phải điều ngược lại - một ý tưởng mà thời gian của chúng ta hy vọng sẽ không bao giờ đến.

Bằng sáng chế, “QUERY FORMULATION VIA TASK CONTINUUM”, được xuất bản ngày hôm qua (22/9/2016), lưu ý rằng khả năng tìm kiếm hiệu quả được nâng cao nếu có thêm thông tin về mục đích của người dùng, đưa ra ví dụ về một người làm báo cáo học tập về khiêu vũ và lưu ý rằng mặc dù người dùng đã thực hiện một số công việc, khi họ nhấn trình duyệt để tìm kiếm, công cụ tìm kiếm sẽ không biết người dùng đang làm gì ngoại trừ những gì họ đã nhập vào thanh tìm kiếm.

Họ lưu ý:

Mọi người sử dụng nhiều ứng dụng máy tính để bàn để hoàn thành một tác vụ duy nhất. Ví dụ: nếu người dùng đang nghiên cứu chủ đề “khiêu vũ” cho trường học, người dùng sẽ sử dụng ứng dụng đầu tiên để viết mọi thứ cũng như ứng dụng thứ hai, chẳng hạn như trình duyệt, để tìm kiếm các phong cách khiêu vũ khác nhau. Tuy nhiên, trong các hệ thống hiện có, hai ứng dụng hoàn toàn bị ngắt kết nối với nhau. Ứng dụng đầu tiên không cung cấp cho trình duyệt những gợi ý ngầm về những gì người dùng có thể đang tìm kiếm khi có sự chuyển đổi từ ứng dụng đầu tiên sang ứng dụng thứ hai. Người dùng nhận thức các nhiệm vụ trong tổng thể. Tuy nhiên, vì các ứng dụng thường bị ngắt kết nối và không được hệ điều hành (OS) trung gian theo bất kỳ cách nào, nên hệ thống máy tính không có ý tưởng về mục tiêu tổng thể của người dùng.

Giải pháp của Microsoft cho câu hỏi hóc búa này là nhờ một người đại diện hoặc “người hòa giải” theo dõi những gì người dùng đang làm trong “các ứng dụng bên thứ 3 đang hoạt động”, chẳng hạn như trình đọc PDF trình xử lý văn bản, nhận dạng hình ảnh hoặc văn bản từ ảnh họ đang xem, nhận dạng âm nhạc hoặc âm thanh, vị trí của họ và dữ liệu ngữ cảnh khác, xóa thông tin nhận dạng cá nhân khỏi dữ liệu này và thêm thông tin đó theo một cách nào đó vào truy vấn tìm kiếm để tạo ra kết quả được xếp hạng tốt hơn và có trọng tâm hơn.

Bằng sáng chế ghi chú:

Kiến trúc được tiết lộ bao gồm thành phần dàn xếp (ví dụ: API (giao diện chương trình ứng dụng) như một phần của hệ điều hành (OS)) xác định các ứng dụng đã tham gia — các ứng dụng mà người dùng đang tương tác để hoàn thành nhiệm vụ (ngược lại với các ứng dụng không hoạt động — các ứng dụng người dùng không tương tác để hoàn thành tác vụ), đồng thời thu thập và chủ động theo dõi thông tin từ các ứng dụng tương tác (ví dụ: văn bản hiển thị trực tiếp cho người dùng, văn bản nhúng trong ảnh, dấu vân tay của bài hát, v.v.) để suy ra ngữ cảnh làm việc của người dùng . Sau đó, ngữ cảnh được suy ra có thể được chuyển giao cho một trong các ứng dụng, chẳng hạn như trình duyệt (ngữ cảnh được suy ra trong một biểu mẫu không vượt qua rào cản quyền riêng tư) để cung cấp xếp hạng được cải thiện cho các truy vấn được đề xuất thông qua nhà cung cấp dịch vụ tìm kiếm ưa thích. Vì ngữ cảnh được suy ra thành các khái niệm, nên không có PII (thông tin nhận dạng cá nhân) nào được truyền đạt mà không có sự đồng ý của người dùng — chỉ những khái niệm ngữ cảnh cấp rất cao mới được cung cấp cho các công cụ tìm kiếm.
Kiến trúc cho phép thu các tín hiệu (ví dụ: văn bản thuần túy được hiển thị cho người dùng, văn bản được nhận dạng từ hình ảnh, âm thanh từ một bài hát hiện đang phát, v.v.) và phân cụm các tín hiệu này thành các khái niệm theo ngữ cảnh. Những tín hiệu này là dữ liệu cấp cao (ví dụ: từ) giúp xác định những gì người dùng đang làm. Hành động thu tín hiệu này mang tính thời gian, trong đó nó có thể thay đổi liên tục (ví dụ: tương tự như trung bình chạy của các khái niệm theo ngữ cảnh). Các tín hiệu có thể liên tục thay đổi dựa trên những gì người dùng đang làm tại thời điểm T (và những gì người dùng đã làm từ T-10 đến thời điểm T).
Khi sử dụng ứng dụng trình duyệt làm ứng dụng sử dụng các tín hiệu thu được, trình duyệt sẽ phát và nhận (ví dụ: liên tục, định kỳ, theo yêu cầu, v.v.) với thành phần dàn xếp thông qua API dàn xếp của thành phần dàn xếp để tìm nạp ngữ cảnh mới nhất các khái niệm.
Khi người dùng cuối cùng tương tác với hoặc được dự đoán sẽ tương tác với, trình duyệt (có thể được tính là xảy ra thường xuyên và / hoặc dựa trên lịch sử các hành động liên tiếp của người dùng dẫn đến việc người dùng tương tác với trình duyệt tiếp theo), các khái niệm theo ngữ cảnh được gửi đến nhà cung cấp dịch vụ tìm kiếm cùng với tiền tố truy vấn. Công cụ tìm kiếm (ví dụ: Bing ™ và Cortana ™ (một trợ lý nhận dạng giọng nói kỹ thuật số cá nhân thông minh) của Microsoft Corporation) sử dụng các trình xếp hạng theo ngữ cảnh để điều chỉnh xếp hạng mặc định của các truy vấn được đề xuất mặc định nhằm tạo ra các truy vấn đề xuất phù hợp hơn cho thời điểm. Hệ điều hành, bao gồm chức năng của thành phần dàn xếp, theo dõi tất cả dữ liệu văn bản được hiển thị cho người dùng bởi bất kỳ ứng dụng nào, sau đó thực hiện phân nhóm để xác định mục đích của người dùng (theo ngữ cảnh).
Mục đích của người dùng được suy luận được gửi dưới dạng tín hiệu đến các nhà cung cấp dịch vụ tìm kiếm để cải thiện xếp hạng các đề xuất truy vấn, cho phép cải thiện tương ứng trong trải nghiệm người dùng vì các đề xuất truy vấn phù hợp hơn với những gì người dùng thực sự đang cố gắng đạt được. Kiến trúc không bị giới hạn đối với văn bản, nhưng có thể sử dụng văn bản được nhận dạng trong ảnh được hiển thị cũng như thông tin vị trí địa lý (ví dụ: hệ thống định vị toàn cầu (GPS)) được cung cấp như một phần của siêu dữ liệu ảnh. Tương tự, một tín hiệu khác có thể là dấu vân tay âm thanh của bài hát đang phát.
Như đã chỉ ra, việc phân loại truy vấn được giải quyết do bộ đệm theo ngữ cảnh và bộ nhớ cache được chia sẻ có thể được sử dụng bởi các ứng dụng khác nhau để cải thiện mức độ liên quan của tìm kiếm, quyền riêng tư được duy trì vì chỉ một lượng thông tin vừa đủ tối thiểu được gửi từ ứng dụng này sang ứng dụng khác và suy ra ngữ cảnh người dùng có thể được chia sẻ trên các ứng dụng, thành phần và thiết bị.
Ví dụ, thành phần dàn xếp có thể là một phần của Hệ điều hành và / hoặc một mô-đun hoặc thành phần riêng biệt trong giao tiếp với Hệ điều hành. Là một phần của Hệ điều hành, thành phần dàn xếp xác định các ứng dụng không phải Hệ điều hành được tham gia trên thiết bị và thu thập và chủ động giám sát thông tin từ các ứng dụng được tham gia để suy ra bối cảnh làm việc của người dùng. Sau đó, ngữ cảnh được suy ra có thể được chuyển tới một trong các ứng dụng, chẳng hạn như trình duyệt theo cách an toàn để cung cấp xếp hạng được cải thiện cho các truy vấn được đề xuất thông qua nhà cung cấp dịch vụ tìm kiếm ưa thích.

Trong ngắn hạn, Clippy trên steroid.

Mối quan tâm chính với một hệ thống như vậy tất nhiên là dữ liệu cá nhân bị rò rỉ bất chấp các biện pháp bảo vệ quyền riêng tư được cho là của Microsoft hoặc đọc nhầm ngữ cảnh của người dùng dẫn đến nhiều thất vọng hơn (một vấn đề khác của Clippy).

Mặt khác, một nhân viên rất thông minh chắc chắn sẽ tốt hơn nếu họ biết mọi thứ về tôi, và có nhiều người nói rằng quyền riêng tư đã chết.

Bằng sáng chế theo một số cách tương tự như Tìm kiếm trên màn hình hoặc Hiện hành của Google, dùng để quét màn hình ứng dụng cho văn bản và thông tin khác, sau đó khởi chạy Tìm kiếm theo ngữ cảnh của Google. Tuy nhiên, nó nghe có vẻ xa hơn một chút và tự chủ hơn rất nhiều.

Độc giả của chúng tôi nghĩ gì về bằng sáng chế này? Hãy cho chúng tôi biết bên dưới.

Thông tin thêm về các chủ đề: bing, Cortana, microsoft, bằng sáng chế, Quyền riêng tư