Izboljšanje Pomočnika Google: »Poglej in govori«, več hitrih stavkov, izboljšano prepoznavanje tonov kože in prihodnji razvoj

Ikona časa branja 4 min. prebrati


Bralci pomagajo pri podpori MSpoweruser. Če kupujete prek naših povezav, lahko prejmemo provizijo. Ikona opisa orodja

Preberite našo stran za razkritje, če želite izvedeti, kako lahko pomagate MSPoweruser vzdrževati uredniško skupino Preberi več

V zadnjem času opažamo veliko izboljšav v Googlovem pomočniku. Ena izmed najboljših stvari, ki jih je treba izpostaviti, je uradna oseba podjetja Objava nove funkcije programske aplikacije, imenovane »Poglej in govori« med glavnim govorom Google I/O. Kljub temu pa obstajajo tudi druge podrobnosti, ki jih je vredno omeniti in ceniti, še posebej, če se v svojih vsakodnevnih dejavnostih močno zanašate na pomočnika. Ti vključujejo izboljšanje Google Assitanta v smislu prepoznavanja odtenkov kože in razširitev knjižnice hitrih besednih zvez.

Pred kratkim je nova funkcija Look and talk, ki jo je predstavil Google, razširjena na vse Hub gnezda Max uporabnikov v ZDA. Glavna ideja je preprosta: naredite interakcijo uporabnikov z napravo enostavnejšo in predvsem bolj naravno. To poenostavi dostavo ukazov Google Assitantu, tako da odstrani namigalni stavek »Hey Google« vsakič, ko mora oseba aktivirati Nest Hub Max. Funkcija deluje prek usklajevanja različnih tehnologij, ki jih integrira Google. Natančneje, Look and Talk uporablja zmogljivosti sistema Face Match in Voice Match, ki mu pomaga določiti, kdaj naj se odzove.

S funkcijo Look and Talk mora uporabnik stati največ 5 metrov stran od Nest Hub Max, strmeti in ukazovati Google pomočnik. »Recimo, da moram popraviti kuhinjsko pomivalno korito, ki pušča,« pravi podpredsednica Googlovega pomočnika Sissie Hsiao in poskuša razložiti, kako deluje Look and Talk v objavi na blogu. "Ko vstopim v sobo, lahko samo pogledam svoj Nest Hub Max in rečem 'Pokaži vodovodarje v moji bližini', ne da bi mi bilo treba najprej reči 'Hey Google'."

Hsiao tudi dodaja, da je videoposnetek interakcij, ki jih analizira pomočnik, "v celoti obdelan v napravi", kar zagotavlja, da se vaši podatki ne delijo z Googlom ali drugimi aplikacijami tretjih oseb. Hsiao tudi poudarja, da nova funkcija spoštuje zasebnost, zato se lahko kadar koli odločite zanjo ali jo izključite. Sprva je deaktiviran in ga morate vklopiti prek aplikacije Google Home. Pojdite na nastavitev naprave Nest Hub Max, nato na »Prepoznavanje in skupna raba«, nato na meni »Face match« in vklopite nastavitev.

"V zakulisju se veliko dogaja, da prepoznate, ali dejansko vzpostavljate očesni stik s svojo napravo, namesto da bi jo le mimogrede pogledali," ugotavlja Hsiao. "Pravzaprav je potrebnih šest modelov strojnega učenja za obdelavo več kot 100 signalov iz kamere in mikrofona - kot so bližina, usmerjenost glave, smer pogleda, gibanje ustnic, zavedanje konteksta in klasifikacija namena - vse v realnem času."

Po drugi strani pa je glede na to, da Look and Talk deluje prek Face Match, pomembno omeniti, da je Google poskrbel, da je učinkovit za različne uporabnike, tako da je vključil tehnologijo Real Tone, ki jo je predstavil lani. To omogoča, da kamera Nest Hub Max učinkovito deluje pri različnih tonih kože. Poleg tega podjetje obljublja, da bo napredovalo še naprej z uporabo "Mehovske lestvice tonov kože", da bi stroju pomagalo pri učinkovitejšem razumevanju slik.

Poleg tega Google v upanju, da bo zmanjšal potrebo po več izgovarjanju namigovalnega izraza »Hey Google«, vključuje tudi več hitre fraze v Nest Hub Max. To uporabnikom olajša stvari, ne da bi jim bilo treba strmeti v kamero naprave ali stati pred njo. Tako kot Look and Talk je tudi Voice Match, ki upravlja delo hitrih stavkov, mogoče izklopiti in vklopiti.

Medtem ko izboljšave, ki jih je razkril Google, so pomočnika tokrat bolj zadovoljive, Google pravi, da ima še vedno več načrtov za programsko opremo v prihodnosti. Vključuje dajanje boljših govornih in jezikovnih modelov za »razumevanje odtenkov človeškega govora«. Trenutno podjetje dela na čipu Tensor, izdelanem po meri, da bi pomočniku omogočil, da na najhitrejši možni način obravnava naloge strojnega učenja v napravi. Ko bo uspešen, Google pravi, da bo ta obetavna tehnologija pomagala pomočniku pri boljšem razumevanju človeškega govora tudi ob prisotnosti nepotrebnih polnil (na primer »uhm« ali »ahh«) in premorih, ko nekdo govori.

Pustite Odgovori

Vaš e-naslov ne bo objavljen. Obvezna polja so označena *