Umělá inteligence se v mnoha oborech stala užitečným pomocníkem. Lékařům usnadňuje diagnostikování nemocí, meteorologům pomáhá s předpověďmi počasí a podnikům se zpracováním velkého množství dat. AI však není nástroj určený pouze pro úzce specializované odborníky. Usnadňuje život i lidem se zrakovým postižením či narušenou komunikační schopností. 

Právě na bázi AI funguje aplikace Lookout z dílny společnosti Google. Pomáhá lidem se zhoršenou schopností vidění s každodenními úkoly. Kombinace umělé inteligence a fotoaparátu v telefonu umožňuje třeba roztřídit nákup nebo nahlas přečíst příchozí e-mail.  

„Když používáte Lookout poprvé, zkrátka namiřte kameru na prostor kolem sebe a aplikace jej začne automaticky popisovat,“ vysvětluje Patrick Clary, produktový manažer, který má v Googlu na starosti to, aby všechny služby tohoto IT gigantu byly dostupné a použitelné i pro lidi s postižením.   

Při navrhování aplikace Lookout hovořili podle Claryho inženýři Googlu s řadou lidí s různým typem zrakového postižení, aby do hloubky pochopili jejich potřeby. Zjistili, že právě nezávislost na druhých při vykonávání každodenních činností je tím, co je pro ně nejdůležitější. 

„Tato technologie mi pomáhá třeba správně spárovat ponožky. Dřív mi s tím musela pomáhat dcera,“ říká jedna z uživatelek Lookoutu.

Aplikace dokáže pomoci se čtením textů a rozpoznáváním znaků vytištěných na papíru. „Bez použití této aplikace je občas těžké rozpoznat hodnotu peněz, protože podle hmatu jsou všechny bankovky cítit stejně,“ směje se další uživatel Lookoutu.

Možnost se vyjádřit

Miliony lidí po celém světě mají narušenou schopnost komunikace, jinými slovy poruchy řeči a motoriky, které jim ztěžují mluvení a dorozumění se s okolím. Občas jsou odkázáni pouze na možnost komunikovat očima. Look to Speak je mobilní aplikace, která díky AI umožňuje lidem očima vybírat přednastavené fráze a nechat je mobil přehrát nahlas tak, aby je slyšeli ostatní. 

„Úkolem našeho projektu bylo soustředit se na pomoc lidem, kteří mají závažné problémy v komunikaci s okolím, kteří nemohou mluvit nebo tuto schopnost ztrácejí,“ říká terapeut a technický manažer společnosti Google Richard Cave. Právě úzký tým kolem něho začal v roce 2020 na aplikaci pracovat. 

Jednou z žen, jimž Look to Speak v každodenním životě pomáhá, je umělkyně Sára, úspěšná žena a matka s mnoha životními zkušenostmi, která zároveň nemá přirozený hlas a komunikuje pouze prostřednictvím pohybu očí. Díky aplikaci může Sára pohledem vybrat na mobilu kýženou frázi nebo vyhláskovat slovo a přístroj ho za ni vysloví. Kamera smartphonu či tabletu snímá její tvář a díky umělé inteligenci měří a analyzuje pohyby jejích očí, vybírá podle toho z obrazovky písmena či fráze a usnadňuje tak komunikaci. 

„Myšlenkou našeho projektu nebylo nahradit vysoce výkonné komunikační pomůcky, ale umožnit lidem vyslat krátká sdělení v těch momentech, kde tyto běžné nástroje z nějakého důvodu nestačí. Protože existují i momenty, kdy třeba ztratíte hlas jen na určitý čas. Chtěli jsme usnadnit komunikaci lidem z různých socioekonomických prostředí po celém světě, a proto jsme využili mobil, který má skutečně každý, a postavili tuto aplikaci na umělé inteligenci,“ vysvětluje Cave. 

Rozdíl mezi zmateným pohledem a porozuměním 

Problémy dorozumět se mají i lidé, kteří sice hlas neztratili, ale jejich řeč není standardní, a pro ostatní je tudíž těžko srozumitelná. Mezi tyto lidi patří například brand manažerka Googlu Aubrie Lee, trpící svalovou dystrofií: „Jsem zvyklá vídat ve tvářích těch, jimž se snažím něco říct, neporozumění. Když mi někdo nerozumí, nemůže mě ani pořádně poznat a vytváří se mezi námi taková neviditelná bariéra,“ popisuje Lee.

Relate je experimentální projekt Googlu, prozatím ve stadiu beta testu. Jde o mobilní aplikaci, v níž umělá inteligence převádí slova vyřčená člověkem s komunikačním handicapem do syntetizovaného, srozumitelného hlasu. Když uživatel začne s aplikací pracovat, dostane za úkol říct několik frází, z nichž se Project Relate naučí, jak zní jeho unikátní hlas a řeč, a dokáže ji pak převést do syntetizovaného, robotického hlasu, přepsat do textové formy nebo zadat jako úkol systému Google Assistant.

Project Relate je pokračováním dlouholetého výzkumu týmů v Googlu, které se zabývají porozuměním mluvenému slovu. Pokrok v této oblasti byl umožněn díky více než milionu vzorků řeči, které nahráli účastníci výzkumu, a umělé inteligenci. 

Článek vznikl ve spolupráci se společností Google.