פטנט מפחיד של מיקרוסופט יגרום ל-Windows לצפות בכל מה שאתה עושה, לשלוח אותו ל-Bing, לקבלת תוצאות חיפוש טובות יותר

סמל זמן קריאה 6 דקות לקרוא


קוראים עוזרים לתמוך ב-MSpoweruser. אנו עשויים לקבל עמלה אם תקנה דרך הקישורים שלנו. סמל טיפים

קרא את דף הגילויים שלנו כדי לגלות כיצד תוכל לעזור ל-MSPoweruser לקיים את צוות העריכה קרא עוד

מפחיד-קורטנה

בדפדוף בספריית הפטנטים של מיקרוסופט אנו נתקלים לעתים קרובות ברעיונות שהיינו רוצים שהם יישמו, אך מעולם לא הגיעו למוצר.

היום נתקלנו בהיפך - רעיון שזמנו אנו מקווים שלא יגיע.

הפטנט, " QUERY FORMULATION VIA TASK CONTINUUM ", שפורסם אתמול (22/9/2016), מציין שחיפוש יעיל משתפר אם יש מידע נוסף לגבי כוונת המשתמש, נותן דוגמה של מישהו שעורך דוח בית ספר על ריקוד, וכן שים לב שלמרות שהמשתמש עשה כבר עבודה מסוימת, כאשר הוא לוחץ על הדפדפן כדי לחפש למנוע החיפוש לא היה מושג על מה המשתמש עובד מלבד מה שהוא הקליד בשורת החיפוש.

הם מציינים:

אנשים משתמשים במספר יישומי שולחן עבודה כדי להשלים משימה אחת. לדוגמה, אם משתמש חוקר את הנושא של "ריקוד" לבית הספר, המשתמש ישתמש באפליקציה ראשונה כדי לרשום דברים וכן באפליקציה שנייה כגון דפדפן, כדי לחפש סגנונות ריקוד שונים. עם זאת, במערכות קיימות, שתי האפליקציות מנותקות לחלוטין זו מזו. האפליקציה הראשונה אינה מספקת לדפדפן רמזים מרומזים לגבי מה שהמשתמש עשוי לחפש כאשר יש מעבר מהאפליקציה הראשונה לאפליקציה השנייה. המשתמש תופס משימות במכלול. עם זאת, מכיוון שיישומים בדרך כלל מנותקים, ואינם מתווכים בשום אופן על ידי מערכת ההפעלה (OS), למערכת המחשוב אין מושג לגבי המטרה הכוללת של המשתמש.

הפתרון של מיקרוסופט לחידה הזו הוא שיהיה סוכן או "מתווך" שיצפה במה שהמשתמש עושה ב"יישומי צד שלישי פעילים" כגון קורא PDF למעבד תמלילים, זיהוי תמונות או טקסט מהתמונות שהם מסתכלים בהן, מזהה מוזיקה או צליל, מיקומם ונתונים הקשריים אחרים, הסרת מידע אישי מזהה מהנתונים הללו, והוספתו בדרך כלשהי לשאילתת החיפוש כדי להפיק תוצאות מדורגות יותר וממוקדות יותר.

הפטנט מציין:

הארכיטקטורה שנחשפה כוללת רכיב תיווך (למשל, API (ממשק תוכניות יישומים) כחלק ממערכת ההפעלה (OS)) המזהה יישומים מעורבים - יישומים שהמשתמש מקיים איתם אינטראקציה לצורך השלמת משימה (בניגוד ליישומים רדומים - יישומים המשתמש אינו מקיים אינטראקציה לצורך השלמת משימה), והוא אוסף ומנטר באופן פעיל מידע מהיישומים המעורבים (למשל, טקסט המוצג ישירות למשתמש, טקסט המוטבע בתמונות, טביעת אצבע של שירים וכו') כדי להסיק את הקשר העבודה של המשתמש . לאחר מכן ניתן להעביר את ההקשר המוסק לאחד מהיישומים, כגון דפדפן (ההקשר המוסק בצורה שאינה חוצה את מחסום הפרטיות) כדי לספק דירוג משופר עבור השאילתות המוצעות באמצעות ספק החיפוש המועדף. מכיוון שההקשר מוסק למושגים, לא מועבר PII (מידע אישי מזהה) ללא הסכמת המשתמש - רק מושגים הקשריים ברמה גבוהה מאוד מסופקים למנועי החיפוש.
הארכיטקטורה מאפשרת לכידת אותות (למשל, טקסט רגיל המוצג למשתמש, טקסט מזוהה מתמונות, אודיו משיר שמתנגן כעת וכן הלאה), ומקבצת את האותות הללו למושגים הקשריים. האותות הללו הם נתונים ברמה גבוהה (למשל, מילים) שעוזרים לזהות מה המשתמש עושה. פעולה זו של לכידת אותות היא זמנית, בכך שהיא יכולה להיות משתנה כל הזמן (למשל, בדומה לממוצע הרץ של מושגים הקשריים). האותות יכולים להשתנות ללא הרף בהתבסס על מה שהמשתמש עושה בזמן T (ומה שהמשתמש עשה מ-T-10 ועד לשעה T).
כאשר משתמשים באפליקציית הדפדפן כאפליקציה שמשתמשת באותות שנלכדו, הדפדפן משדר ומקבל (למשל, ברציפות, מעת לעת, לפי דרישה וכו') עם רכיב התיווך באמצעות API של תיווך של רכיב התיווך כדי להביא את ההקשר העדכני ביותר מושגים.
כאשר המשתמש בסופו של דבר מקיים אינטראקציה עם הדפדפן, או צפוי לקיים איתו אינטראקציה (כפי שעשוי להיחשב כמתרחש לעתים קרובות ו/או בהתבסס על היסטוריה של פעולות משתמש עוקבות שמביאות לאינטראקציה של המשתמש עם הדפדפן לאחר מכן), המושגים ההקשריים נשלחים לספק החיפוש יחד עם קידומת השאילתה. מנוע החיפוש (למשל, Bing™ ו-Cortana™ (עוזר אינטליגנטי אישי לזיהוי דיבור דיגיטלי) מאת Microsoft Corporation) משתמש במדרגים הקשריים כדי להתאים את דירוג ברירת המחדל של שאילתות ברירת המחדל המוצעות כדי לייצר שאילתות מוצעות רלוונטיות יותר לנקודת הזמן. מערכת ההפעלה, הכוללת את הפונקציה של רכיב התיווך, עוקבת אחר כל הנתונים הטקסטואליים המוצגים למשתמש על ידי כל אפליקציה, ולאחר מכן מבצעת אשכולות כדי לקבוע את כוונת המשתמש (באופן הקשרי).
כוונת המשתמש המשוערת הנשלחת כאות לספקי החיפוש לשפר את דירוג ההצעות לשאילתות, מאפשרת שיפור מקביל בחוויית המשתמש שכן הצעות השאילתה רלוונטיות יותר למה שהמשתמש מנסה להשיג בפועל. הארכיטקטורה אינה מוגבלת לטקסט, אך יכולה להשתמש בטקסט מזוהה בתמונות המוצגות וכן במידע על מיקום גיאוגרפי (למשל, מערכת מיקום גלובלית (GPS)) המסופק כחלק ממטא נתונים של התמונה. באופן דומה, אות נוסף יכול להיות טביעת אצבע אודיו של שיר שמתנגן כעת.
כפי שצוין, ביעור השאילתה נפתר עקב המטמון ההקשרי והמשותף שניתן להשתמש בו על ידי יישומים שונים כדי לשפר את רלוונטיות החיפוש, הפרטיות נשמרת מכיוון שרק כמות מידע מספקת מינימלית נשלחת מאפליקציה אחת לאפליקציה אחרת, וההשלכה ניתן לשתף את הקשר המשתמש בין יישומים, רכיבים והתקנים.
רכיב התיווך יכול להיות חלק ממערכת ההפעלה, ו/או מודול או רכיב נפרד בתקשורת עם מערכת ההפעלה, למשל. כחלק ממערכת ההפעלה, רכיב התיווך מזהה יישומים מעורבים שאינם מערכת הפעלה במכשיר, אוסף ומנטר באופן פעיל מידע מהאפליקציות המעורבות כדי להסיק את הקשר העבודה של המשתמש. לאחר מכן ניתן להעביר את ההקשר המסיק לאחד מהיישומים, כגון הדפדפן, בצורה מאובטחת כדי לספק דירוג משופר עבור השאילתות המוצעות דרך ספק החיפוש המועדף.

בקיצור, קליפי על סטרואידים.

הדאגה העיקרית של מערכת כזו היא כמובן דליפת מידע אישי למרות הגנת הפרטיות לכאורה של מיקרוסופט או קריאת ההקשר של המשתמש בצורה שגויה המובילה ליותר תסכול (עוד בעיה של Clippy).

מצד שני סוכן מאוד אינטליגנטי בהחלט יהיה טוב יותר אם הוא ידע הכל עלי, ויש הרבה שאומרים שהפרטיות כבר מתה.

הפטנט דומה במובנים מסוימים ל- Now on Tap או Screen Search של גוגל, שמגרד מסך אפליקציה לטקסט ומידע אחר ולאחר מכן משיק חיפוש Google בהקשר. עם זאת, זה נשמע קצת יותר מרחיק לכת והרבה יותר אוטונומי.

מה חושבים הקוראים שלנו על הפטנט הזה? ספר לנו למטה.

עוד על הנושאים: בינג, Cortana, מיקרוסופט, פטנט, פרטיות