Počítače pochopí i sarkasmus

Rozpoznávat hlas zvládnou i počítače staré desítky let. Samozřejmě se zlepšují, ale mnohem důležitější je pochopení kontextu. S tím si ale poradí matematika.


Hlasové ovládání je základem každé interakce ve vědeckofantastických filmech. Není proto divu, že se vědci o tento způsob komunikace s počítačem pokoušeli již na konci minulého století, kdy výkon začal dostačovat pro nutné porovnání vzorků v rámci databáze.


Rozpoznávání hlasu se postupně zlepšovalo a nyní je díky obrovským statistickým datům již poměrně přesné a v mnoha případech velmi dobře použitelné. To je ale pouze první část v rámci pokroku umělé inteligence.


Další fází je totiž pochopení kontextu a smyslu věty, protože klasické zpracování oddělených slov zkrátka nebude dávat smysl. To je mnohem komplikovanější záležitost než prostý převod hlasu na text.


Počítače pod dohledem psychologů


Vědci ze stanfordské univerzity zveřejnili novou studii, která se zabývá matematickými modely v oblasti prediktivní pragmatické úvahy. Ta by měla posunout možnosti počítačů na zcela novou úroveň.


Nová „technologie“, pokud ji jako technologii můžeme nazvat, by měla pomoci počítačům rozpoznávat velmi jemné rozdíly ve větné skladbě. Zaměřuje se na kontext a sociální pravidla lidského světa.


Některé skupiny slov či celé věty dávají smysl pouze tehdy, jsou-li přiřazeny k nějaké události, okolnosti osobě nebo místu. I když zatím nelze uvažovat o extrémně složitých vyjádřeních typu „Honza šel na jedno“, existují i jednodušší jazyková spojení, které lze určitým způsobem zpracovat a správně pochopit. Například „Dostal červenou kartu, takže jde do šaten.“ Na první pohled nedává tato věta smysl, tedy pokud neznáte lidské hry, konkrétně fotbal, jeho pravidla a události, které během utkání relativně často probíhají.


A právě to chce dvojice psychologů ze Stanfordu zlepšit pomocí nových matematických modelů. První náznaky pochopení kontextu se začínají objevovat v mobilních zařízeních. Například v iPhonu od Applu je služba Siri, která dokáže částečně pochopit i složitější úlohy. Využívá k tomu dodatečné informace jako třeba GPS polohu, díky které ví, kde se nacházíte a podle toho přizpůsobí svou analýzu potřebných dat a výslednou odpověď.


Co je myšleno, nemusí být řečeno


Důležitou část lidské řeči tvoří různé formy vyjádření, které významově neodpovídají přesně vyřčené skupině slov. Mezi typické příklady patří ironie, černý humor (různé formy vtipů), sarkasmus, parodie, hyperbola, antifráze, litotes a další. K mnoha typům vyjádření je zapotřebí sledovat i výslovnost, která ukazuje na pravý význam pronesených slov.


Pokud budeme brát v potaz i vyšší stupeň, přichází nutnost sledování aktuálních událostí ve světě a přizpůsobení kontextu dle nových dat a tedy neustálé učení se v rámci nějaké formy umělé inteligence. Lidstvo zkrátka stále nemá k dispozici počítač, který by pochopil větu „Na povolení stavby bude stačit jedna krabice s vínem.“ Ale jednou se určitě dočkáme, nutností bude ale neustálé učení s obrovským výpočetním výkonem.


Postupné zlepšování


Budoucí vývoj v této oblasti nelze očekávat rychlými skoky, ale postupným zlepšováním, stejně jako tomu bylo a je u rozpoznávání řeči. Dokonalé řešení nelze naprogramovat takříkajíc od stolu, ale je nutné se i zlepšovat v rámci dostupných vzorků.


Lidé, kteří se blíže znají, znají také většinu výrazů a forem kontextu, který druhý jedinec používá. Tento přístup lze očekávat i u budoucích počítačů. Počítače se tak budou postupně přizpůsobovat lidskému chování a konkrétnímu uživateli, což povede ještě k bližšímu vztahu mezi člověkem a elektronickou formou umělé inteligence.


Jednou vás tak možná váš počítač pochopí lépe, než živý protějšek. A to už bude jen kousek od prvních demonstrací za povolení sňatku mezi stroji a lidmi.

Vyhledejte si ten nejlevnější Hotel se slevou až 80% !

Nejčtenější zprávy