Umělá inteligence jako stroj na významy

Když se dnes mluví o umělé inteligenci, často se používají dvě zkratky. Jedna z ní dělá téměř vědomou bytost, druhá jen rychlou kalkulačku. Ani jedna nevystihuje, co současné jazykové modely skutečně jsou.

Nejviditelnější podobou dnešní AI jsou velké jazykové modely, anglicky Large Language Models neboli LLM. Patří mezi ně například ChatGPT, Claude, Gemini nebo Llama. Dokážou vést rozhovor, vysvětlovat složité věci, psát texty, překládat, shrnovat, navrhovat postupy i pracovat s programovacím kódem.

Jejich schopnost může působit dojmem, že rozumějí světu podobně jako člověk. Přesnější je říci, že velmi dobře pracují s jazykovými stopami lidského porozumění světu. Nemají tělo, smyslovou zkušenost, osobní biografii ani ověřitelně vlastní prožívání. Jejich výkony nevycházejí z přímého života v realitě, ale z práce s daty, znaky a vztahy mezi významy.

Právě zde začíná být užitečná sémiotika.

Od pravidel ke vzorcům

Klasický program funguje tak, že člověk předem určí pravidla a počítač je vykoná. Strojové učení pracuje jinak. Vývojáři modelu neposkytnou úplný seznam pravidel pro každou situaci, ale velké množství příkladů. Model pak hledá opakující se vzorce, podle nichž dokáže vytvářet odhady nebo rozhodnutí.

U rozpoznávání obrazu je to snadno představitelné. Ručně popsat všechny možné podoby kočky by bylo téměř nemožné. Liší se tvarem, barvou, polohou, světlem, kvalitou fotografie i tím, co ji částečně zakrývá. Model místo pevného seznamu znaků dostane mnoho obrazových příkladů a postupně se naučí rozpoznávat statistické vztahy, které se s kočkou pojí.

Jazykové modely pracují podobně, jen jejich materiálem nejsou především obrázky, ale texty. Učí se vztahy mezi slovy, větami, pojmy, styly, argumenty a situacemi, v nichž lidé jazyk používají.

Velký jazykový model není databáze, z níž by prostě vytahoval hotové věty. Při odpovědi vytváří nový text podle vzorců, které si osvojil během tréninku.

Na technické rovině předpovídá, jaká další část textu nejlépe naváže na dosavadní kontext. Tato část se nazývá token. Může to být celé slovo, část slova, koncovka, mezera nebo interpunkční znaménko.

Když model dostane větu „Praha je hlavní město“, dokáže s vysokou pravděpodobností doplnit „České republiky“. U složitějších úloh se princip nemění. Jen pracuje s mnohem delším kontextem a s velkým množstvím možných významových souvislostí.

To, že technický základ lze popsat jako předpovídání dalšího tokenu, neznamená, že je výsledek triviální. Jazyk není pouhá řada slov. Je v něm uložena lidská zkušenost, kultura, argumentace, konflikt, obraznost i paměť.

Jazyk jako systém znaků

Jazyk neslouží jen k předávání hotových informací. Pomáhá lidem svět rozlišovat a uspořádávat. Prostřednictvím slov rozpoznáváme věci, vztahy, hodnoty, emoce, role, pravidla a příběhy.

Slovo „strom“ není strom samotný. Je to znak, tedy něco, co k určité věci, představě nebo souboru představ odkazuje. Když někdo řekne strom, nemusí tím vyvolat pouze botanickou definici. Může se objevit představa lesa, stínu, dřeva, kořenů, dětství, rodokmenu, života nebo ochrany.

Význam proto nevzniká pouze uvnitř slova. Vzniká ve vztahu mezi znakem, situací a tím, kdo znak vykládá.

Sémiotika, někdy označovaná také jako semiologie, se zabývá právě tímto procesem. Zkoumá, jak znaky označují, jak fungují v širších systémech a jak se jejich význam proměňuje podle kontextu.

Jazykové modely neprožívají svět způsobem, jakým jej prožívá člověk. Nevidí strom při chůzi lesem, necítí jeho kůru ani chlad stínu. Pracují s tím, co lidé o stromech napsali, vyfotografovali, naměřili, nakreslili nebo jinak převedli do dat. V jejich učení se potkávají vědecké popisy, pohádky, básně, návody, metafory, právní předpisy i běžné rozhovory.

AI tedy získává svoji jazykovou schopnost z lidské znakové vrstvy světa.

Peirce a vztah znaku, objektu a interpretace

Americký filozof Charles Sanders Peirce popsal znak jako vztah tří částí. Jde o znak, objekt a interpretant.

Znak je to, co něco zastupuje. Může jím být například slovo „oheň“.

Objekt je to, k čemu znak odkazuje. V tomto případě skutečný oheň.

Interpretant je významový účinek, který znak vyvolá. U ohně to může být teplo, světlo, nebezpečí, domov, očista, zkáza nebo vášeň.

Tento model pomáhá vysvětlit rozdíl mezi člověkem a jazykovým modelem. Člověk může mít současně slovo, zkušenost s reálným ohněm i osobní nebo kulturní výklad této zkušenosti. Model má především rozsáhlou síť vztahů mezi znaky a popisy. Ví, že oheň souvisí s kouřem, teplem, požárem, energií nebo obětí, protože se tyto vazby opakují v datech.

Nezná je však proto, že by se někdy spálil nebo měl strach z plamenů. Zná je jako jazykově a datově zachycené vztahy.

To neznamená, že je jeho práce se znaky bezcenná. Naopak. Právě schopnost rychle procházet velké množství významových vazeb je zdrojem jeho síly. Je ale nutné nezaměňovat tuto schopnost za lidskou zkušenost.

Kulturní kódy a kontext

Umberto Eco upozorňoval, že znaky nefungují izolovaně. Jejich význam vzniká v kulturních kódech, zvycích, očekáváních a konkrétních situacích.

Koruna může znamenat panovnickou moc, měnu, ozdobu, historickou památku nebo metaforu úspěchu. Červená může být barvou lásky, krve, zákazu, revoluce nebo nebezpečí. Samotný znak nestačí. Rozhodující je systém, v němž je použit.

Jazykové modely se neučí pouze slovní zásobu. Učí se i tyto kontextové vazby. Díky tomu dokážou měnit styl, přecházet mezi odborným vysvětlením, úředním dopisem, ironickou poznámkou, poezií nebo technickým návodem. Nejde o to, že by rozpoznaly jednu jednoduchou definici slova. Pracují s tím, jak se daný pojem obvykle používá v různých prostředích.

Proto má formulace otázky takový význam. Stejná věc položená právním jazykem, psychologickým jazykem nebo duchovním jazykem vyvolá jiný okruh souvislostí. Model reaguje nejen na jednotlivá slova, ale na rámec, který otázka vytváří.

Co AI neumí nahradit

Současná AI může zpracovávat text, obraz, zvuk, data z nástrojů a v některých případech i informace ze senzorů. Přesto její vztah ke světu zůstává zprostředkovaný. Nežije v něm jako člověk.

Člověk poznává prostřednictvím těla, jednání, vztahů, bolesti, selhání, paměti a odpovědnosti za důsledky. Ví, co je horko, protože je dokáže cítit. Ví, co je ztráta, protože může o něco nebo někoho přijít. Ví, co je riziko, protože nese následky vlastního jednání.

Model může o těchto věcech psát přesně, citlivě a v mnoha stylech. Dokáže shrnout lékařský popis smrti, filozofickou úvahu o konečnosti i literární vyjádření smutku. To samo o sobě však neprokazuje, že smrt, lásku nebo bolest prožívá.

Z praktického hlediska to znamená, že AI může být mimořádně užitečná při práci s informacemi a formulacemi, ale nemůže automaticky převzít lidský úsudek, odpovědnost ani hodnotové rozhodování.

Proč může AI působit přesvědčivě i tehdy, když se mýlí

Jazykový model je optimalizovaný na tvorbu pravděpodobného a kontextově vhodného pokračování textu. Pravděpodobnost však není totéž co pravdivost.

Když model nemá dostatečně spolehlivé podklady, může vytvořit odpověď, která je plynulá, logicky vystavěná a stylisticky přesná, ale věcně chybná. Tento jev se obvykle označuje jako halucinace.

Nejde o šílenství stroje ani o vědomou lež. Jde o situaci, kdy systém skládá věrohodně znějící text bez dostatečného ověření reality.

Plynulost není důkaz. Sebevědomý tón není záruka. Dobře napsaná odpověď stále vyžaduje kontrolu zdrojů, kontextu a důsledků.

Sémiotika zde připomíná podstatnou věc. Znak může být silný a přesvědčivý, aniž by spolehlivě odpovídal skutečnosti. AI dokáže tuto přesvědčivost výrazně zesílit, protože umí rychle vytvářet text ve stylu, který člověk považuje za odborný nebo důvěryhodný.

AI jako technologie znakové vrstvy

Lidstvo po tisíce let ukládá zkušenost do znaků. Nejprve do řeči a symbolů, později do písma, mýtů, zákonů, knih, vědeckých textů, map, technické dokumentace, programovacího kódu a digitálních databází.

Vznikla tím rozsáhlá znaková vrstva lidské civilizace. Není to přesná kopie reality. Je to soubor lidských popisů, výkladů, teorií, pravidel, omylů, konfliktů i představ o tom, co je skutečné a důležité.

Jazykové modely se učí pohybovat právě v této vrstvě. Dokážou spojovat pojmy, rekonstruovat známé argumentační postupy, porovnávat interpretace a vytvářet nové formulace. Jejich inteligence je v tomto smyslu odvozená. Vychází z lidské kulturní a jazykové stopy.

Toto zjištění je důležité i pro způsob, jak AI hodnotit. Model není neutrální přístup k pravdě. Nese v sobě kvalitu i limity materiálu, z něhož se učil. Může reprodukovat znalosti, ale také omyly, předsudky, stereotypy, manipulace a slepá místa společnosti.

Co nám AI může ukázat o jazyce a realitě

Fungování jazykových modelů ukazuje, že lidský jazyk obsahuje překvapivě mnoho pravidelností. Kdyby byl pouze chaotickým shlukem slov, model by nedokázal vytvářet souvislé a často užitečné odpovědi.

Z toho ale neplyne, že AI objevila konečný kód reality. Plyne z toho opatrnější závěr. Lidé popisují, třídí a předávají zkušenost pomocí opakujících se významových struktur. V jazyce se ukládají naše kategorie, metafory, hodnoty, konflikty i nevyslovené předpoklady.

AI proto může sloužit jako nástroj pro jejich zkoumání. Může pomoci odhalovat opakující se argumenty, jazykové rámce, kulturní vzorce nebo místa, kde náš způsob mluvení vede k nejasnosti či manipulaci.

Zde začíná filozofická rovina celé otázky. Je možné uvažovat, zda pravidelnosti v jazyce pouze odrážejí lidský způsob uspořádávání světa, nebo zda ukazují i na hlubší struktury reality samotné. To není technicky vyřešený fakt. Je to legitimní hypotéza pro další sémiotické, filozofické a kulturní zkoumání.

Důležité je nepřeskakovat bez důkazu od schopnosti modelu pracovat s jazykem k tvrzení, že model odhalil podstatu bytí. AI nám zatím především ukazuje, jak mnoho je lidský svět prostoupen znaky a jak silně jazyk ovlivňuje to, co dokážeme vidět, pojmenovat a sdílet.

Závěr

Velké jazykové modely nejsou lidské mysli. Nemají tělo, vlastní životní zkušenost ani ověřeně subjektivní prožívání.

Jsou to systémy strojového učení, které se naučily pracovat s jazykem na mimořádně vysoké úrovni. Technicky vytvářejí další části textu podle kontextu. Prakticky se tím pohybují v rozsáhlé síti lidských znaků, kulturních kódů a významových vztahů.

Proto je sémiotika pro porozumění AI důležitá. Pomáhá rozlišit mezi slovem a věcí, mezi znakem a jeho výkladem, mezi přesvědčivým sdělením a pravdivým popisem.

AI nepracuje přímo s realitou. Pracuje hlavně se způsoby, jimiž lidé realitu popsali, vyložili, roztřídili a uchovali. Je to silný nástroj, ale zároveň zrcadlo lidské kultury.

Největší hodnota AI nemusí být v tom, že za člověka převezme myšlení. Může spočívat v tom, že nás přinutí přesněji sledovat vlastní jazyk, vlastní rámce a vlastní předpoklady. Tedy mechanismy, jimiž převádíme realitu do významu.