Google Asistan'ı İyileştirme: "Bak ve Konuş", daha hızlı ifadeler, iyileştirilmiş cilt tonu tanıma ve gelecekteki gelişmeler

Okuma zamanı simgesi 4 dk. okuman


Okuyucular MSpoweruser'ı desteklemeye yardımcı olur. Bağlantılarımız aracılığıyla satın alırsanız komisyon alabiliriz. Araç İpucu Simgesi

MSPoweruser'ın editör ekibini ayakta tutmasına nasıl yardımcı olabileceğinizi öğrenmek için açıklama sayfamızı okuyun. Daha fazla

Son zamanlarda Google Asistan'da çok sayıda iyileştirme görüyoruz. Vurgulanacak en iyi şeylerden biri şirketin resmi duyuru Google I/O açılış konuşması sırasında yazılım uygulamasının “Look and Talk” adlı yeni özelliğinden. Bununla birlikte, özellikle günlük aktivitelerinizde Asistan'a büyük ölçüde güveniyorsanız, bahsetmeye ve takdir etmeye değer başka ayrıntılar da var. Bunlar, Google Assitant'ın cilt tonlarını tanıma konusundaki iyileştirmesini ve hızlı ifadeler kitaplığını genişletmesini içerir.

Son zamanlarda, Google tarafından tanıtılan yeni Bak ve konuş özelliğinin yaygın olarak herkese yayıldığı görülüyor. Yuva Hub'ı Max ABD'deki kullanıcılar. Bunun arkasındaki ana fikir basittir: Kullanıcıların cihazla olan etkileşimlerini daha basit ve hepsinden önemlisi daha doğal hale getirmek. Bu, bir kişinin Nest Hub Max'i her etkinleştirmesi gerektiğinde "Hey Google" işaret ifadesini kaldırarak komutların Google Assitant'a iletilmesini basitleştirir. Bu özellik, Google tarafından entegre edilen farklı teknolojilerin koordinasyonuyla çalışır. Özellikle Look and Talk, sistemin Face Match ve Voice Match özelliklerini kullanarak ne zaman yanıt vereceğini belirlemesine yardımcı olur.

Bak ve Konuş özelliğini kullanarak, kullanıcının Nest Hub Max'ten en fazla 5 fit uzakta durması, bakması ve komuta etmesi yeterlidir. Google Yardımcısı. Google Başkan Yardımcısı Başkan Yardımcısı Sissie Hsiao, blog gönderisinde Look and Talk'un nasıl çalıştığını açıklamaya çalışırken, "Diyelim ki akan mutfak lavabomu düzeltmem gerekiyor" diyor. "Odaya girerken, önce 'Hey Google' demek zorunda kalmadan Nest Hub Max'ime bakıp 'Yakınımdaki tesisatçıları göster' diyebiliyorum."

Hsiao ayrıca, Asistan tarafından analiz edilen etkileşimlerin videosunun "tamamen cihaz üzerinde işlendiğini" ve verilerinizin Google veya başka herhangi bir üçüncü taraf uygulamasıyla paylaşılmadığından emin olduğunu da ekliyor. Hsiao, yeni özelliğin gizliliğe saygı duyduğunu da vurguluyor, bu nedenle istediğiniz zaman dahil olma veya çıkma seçeneğiniz var. Başlangıçta devre dışıdır ve Google Home uygulaması aracılığıyla açmanız gerekir. Nest Hub Max'in cihaz ayarına, ardından "Tanıma ve paylaşma"ya, ardından "Yüz eşleştirme" menüsüne gitmeniz ve ayarı açmanız yeterlidir.

Hsiao, “Cihazınızla sadece bir bakış atmak yerine gerçekten göz teması kurup kurmadığınızı anlamak için perde arkasında pek çok şey oluyor” diyor. "Aslında, hem kameradan hem de mikrofondan gelen 100'den fazla sinyali (yakınlık, kafa yönlendirmesi, bakış yönü, dudak hareketi, bağlam farkındalığı ve niyet sınıflandırması gibi) gerçek zamanlı olarak işlemek için altı makine öğrenimi modeli gerekiyor."

Öte yandan, Look and Talk'un Face Match ile çalıştığı göz önüne alındığında, Google'ın geçen yıl piyasaya sürdüğü Real Tone teknolojisini dahil ederek onu çeşitli kullanıcılar için etkili hale getirmeyi başardığını belirtmek önemlidir. Bu, Nest Hub Max kameranın farklı cilt tonlarında verimli bir şekilde çalışmasına olanak tanır. Ek olarak şirket, makinenin görüntüleri daha verimli anlamasına yardımcı olmak için “Monk Skin Tone Scale” kullanarak işleri daha da ileriye taşıma sözü veriyor.

Ayrıca, "Hey Google" işaret ifadesini daha fazla söyleme ihtiyacını azaltmak umuduyla, Google ayrıca daha fazlasını içeriyor. hızlı ifadeler Nest Hub Max'te. Bu, cihazın kamerasına bakmak veya önünde durmak zorunda kalmadan kullanıcılar için işleri kolaylaştırır. Bak ve Konuş gibi, hızlı ifadelerin çalışmasını yöneten Ses Eşleştirme de kapatılıp açılabilir.

Google'ın ortaya koyduğu iyileştirmeler, Asistan'ı bu sefer daha tatmin edici hale getirirken Google, gelecekte yazılım için hala daha fazla planı olduğunu söylüyor. “İnsan konuşmasının nüanslarını anlamak” için ona daha iyi konuşma ve dil modelleri vermeyi içerir. Şu anda şirket, Asistan'ın cihazdaki makine öğrenimi görevlerini mümkün olan en hızlı şekilde yerine getirmesini sağlamak için özel olarak tasarlanmış bir Tensor çipi üzerinde çalışıyor. Başarılı olduktan sonra Google, bu umut verici teknolojinin, Asistan'ın gereksiz dolgular ("uhm" veya "ahh" gibi) varlığında bile insan konuşmasını daha iyi anlamasına yardımcı olacağını ve birisi konuşurken durakladığını söylüyor.

Yorum bırak

E-posta hesabınız yayımlanmayacak. Gerekli alanlar işaretlenmişlerdir. *