Алека, Сири и Гоогле не разумеју реч коју кажете

Амазон

Гласовни асистенти као што су Алека, Гоогле Ассистант и Сири су прошли дуг пут у последњих неколико година. Али, за сва њихова побољшања, једна ствар их задржава: они вас не разумеју. Они се превише ослањају на специфичне гласовне команде.

Препознавање говора је само магични трик

Амазон

Гласни асистенти вас не разумеју. Не баш, у сваком случају. Када разговарате са Гоогле почетном страницом или Амазон Ецхо, она суштински претвара ваше ријечи у текстуални низ и онда то успоређује с очекиваним наредбама. Ако пронађе тачно подударање, онда следи низ инструкција. Ако то не уради, тражи алтернативу шта да ради на основу информација које има, а ако то не успе, добијате поруку о грешци као што је „Жао ми је, али не знам То је мало више од магије руке да те превари да мислиш да разуме.

Не може да користи контекстуалне трагове да би на најбољи начин погодила, или чак да користи разумевање сличних тема да би информисала своје одлуке. Није тешко ни подићи гласовне асистенте. Док можете да питате Алека „Да ли радите за НСА?“ И да добијете одговор, ако питате „Да ли сте тајно део НСА?“ Добијате одговор „не знам један“ (барем на време писања).

Људи, који заиста разумију говор, не раде овако. Претпоставимо да питате човека: „Шта је то кларваин на небу? Онај који је засвођен и пун пругастих боја као што су црвена, наранџаста, жута и плава. ”Упркос томе што је кларваин измишљена реч, особа коју сте питали би вероватно могла да схвати из контекста да описујете дугу.

Док ви можете да тврдите да човек претвара говор у идеје, човек онда може применити знање и разумевање да закључи одговор. Ако питате човека ако тајно раде за НСА, они ће вам дати одговор да или не, чак и ако је тај одговор лаж. Човек не би рекао "ја то не знам" на такво питање. То што људи могу лагати је нешто што долази с правим разумијевањем.

Гласовни асистенти не могу ићи изван свог програмирања

Гласовни асистенти су на крају ограничени на програмиране очекиване параметре, а лутање изван њих ће прекинути процес. Та чињеница показује када уређаји треће стране долазе у игру. Обично, команда за интеракцију са њима је веома незграпна, што значи да "кажете произвођачу уређаја да командује необавезним аргументом." Тачан пример би био: "Реците Вхирлпоол-у да заустави сушилицу." Вјештина контролира неке ГЕ пећи. Корисник вештине мора да запамти да “каже Женеви” не “реци ГЕ”, него остатак команде. И док можете да га замолите да загреје рерну на 350 степени, не можете пратити захтев да се температура повећа за још 50 степени. Ипак, човек може да следи ове захтеве.

Амазон и Гоогле су напорно радили на превазилажењу ових препрека, и то показује. Када сте једном морали да пратите горенаведену секвенцу да контролишете паметну браву, сада можете рећи „закључај предња врата“ уместо тога. Алека је некада била збуњена "реци ми виц о псима", али данас питај за једну и то це радити. Додали су варијације командама које користите, али на крају још увијек морате знати праву наредбу. Морате користити исправну синтаксу, у исправном редоследу.

А ако мислите да то звучи као командна линија, не грешите.

Гласовни асистенти су Фанци Цомманд Лине

Командна линија је уско дефинисана да обавља једноставне задатке, али само ако знате одговарајућу синтаксу. Ако извучете из те исправне синтаксе и откуцате дир уместо дир-а, командна линија ће вам дати поруку о грешци. Можете користити псеудониме за лакше памћење команди, али морате да схватите шта су оригиналне команде, како функционишу и како да ефикасно користе псеудониме. Ако не узмете времена да научите додатну и изван командне линије, никада нећете добити много од тога.

Гласовни асистенти се не разликују. Морате знати исправан начин да изговорите наредбу или поставите питање. Морате знати како поставити групе за Гоогле и Алека, зашто је групирање ваших уређаја неопходно и како именовати ваше паметне уређаје. Ако не следите ове неопходне кораке, осетићете фрустрацију када тражите од свог гласовног асистента да искључи студију само да би била постављена, "која студија" треба да буде искључена.

Чак и када користите исправну синтаксу у правом редоследу, процес можда неће успети. Или са погрешним одговором или изненађујућим резултатом. Две Гоогле куће у истој кући могу дати временску прогнозу за мало другачије локације, иако имају приступ истим информацијама о корисничком рачуну и интернетској вези.

У горњем примеру, дата је наредба “Постави тајмер за пола сата”. Гоогле Хоме чвориште је креирало тајмер под називом "Сат", а затим је питао колико дуго би тајмер требао бити. Ипак, понављање исте наредбе три пута исправно је радило и створило 30-минутни тајмер. Употреба наредбе “Постави тајмер за 30 минута” исправно ради на конзистентнијој основи.

Док разговор са Гоогле домом или Ецхо-ом може бити више флуидан, под помоћним гласовним асистентима и командним линијама раде на исти начин. Можда нећете морати да научите нови језик, али морате научити нови дијалект.

Уско разумевање говорних асистената ће ограничити раст

Ништа од тога не спречава гласне асистенте као што је Гоогле Ассистант и Алека да раде довољно добро (иако је Цортана другачија прича). Гоогле помоћник и Алека и претражују он-лине за питања пристојно, иако не изненађујуће Гоогле је бољи у претраживању, и може одговорити на основна питања као што су мјерење конверзије и једноставна математика. Са правилно постављеним паметним домом и добро обученим корисником, већина паметних кућних команди ће радити како је замишљено. Али то је дошло кроз рад и труд, а не интелектуално разумевање.

Тајмери и аларми су били једноставни. Временом је додато име, затим могућност додавања времена тајмеру. Прешли су од једноставнијих на компликованије. Гласовни асистенти могу одговорити на више питања и сваки дан доносе нове вјештине и могућности. Али то није производ само-раста који долази од учења и разумевања.

И ништа од тога не даје инхерентну способност да се користи оно што се зна да стиже до непознатог. За сваку наредбу и питање које функционише, увек ће бити три која неће. Без напретка у А.И. који даје људску способност разумевања, Гласовни асистенти уопште нису асистенти. То су само гласовне командне линије - корисне у правом сценарију али ограничене на оне сценарије које су програмиране да разумију.

Другим ријечима: стројеви уче ствари, али их не могу разумјети.