Neučí se jako lidé. O polidšťování technologií, krysách za volantem a Davidu Humovi.
Proč kamera vidí, motor běží, vítr šeptá a markeťáci lžou?
Nedávno jsem u nás na Palmovce našel u kontíku Vogue CS v mírně čteném stavu. Josef Šlerka v něm v povedeném rozhovoru tvrdí, že boj některých mediálních domů s AI nedává žádný smysl: jejich texty prý přeci nevykrádá, pouze se na nich učí a je to tedy “jako umělci zakazovat číst knihy, aby se ve své fantazii náhodou neinspiroval”.
To vše říká předseda expertní rady Nadačního fondu nezávislé žurnalistiky a dosavadní vedoucí programu Studia nových médií nešťastně uprostřed obřího skandálu Perplexity.ai, proti kterému se v USA vzedmula celá žurnalistická obec a předžalobní výzvy mu zaslal Forbes, Wired i Condé Nast, tedy vydavatel licenčního časopisu, na jehož stránkách se zmíněný rozhovor právě odehrává.
Jedním z neumdlévajících marketingových úskoků a tklivých argumentů kolem strojového učení, Peer2Peer a kontroverzních technologií vůbec je tak stále antropomorfizace jejich funkcí na bázi čistě jazykové spřízněnosti s lidmi. Tou tiskové zprávy zaplavují společenskou představivost, aby si obratem nárokovaly pro svůj produkt lidské zákony i práva.
“I spisovatelé se inspirují. Však se jen učí - jako lidé. Vždyť i umělci kradou!”
Je to zjevně triumfální hot take natolik nevykořenitelný, intuitivní a neodolatelně naivní, že si zaslouží samostatný kopanec s rozeběhem.
Odbydeme si prvně nutné technikum.
Učení z taháku
Člověka k učení nezadržitelně žene zvídavost, instinkty i sociální interakce. Proces lidského učení je poté postaven na pronikavém porozumění: osvojené principy jsou adaptivní, nekonečně škálovatelné a neustále se kalibrují. Mozek oplývá neuroplasticitou a učí se z vlastních chyb, i velmi kusé informace syntetizuje a nachází mezi nimi zákonité spojitosti. Ty pak dokáže sám i velmi kreativně rozvíjet a interpretovat v nečekaných souvislostech.
Strojové učení současných difuzních modelů a LLMs naopak nezná motivaci, emoce ani skutečnou senzorickou zkušenost. V učení nemá agentnost a tudíž nepožívá ani “právo na vzdělání”. Učení naopak model předchází - bez dat není model ničím. Ten pak látce nijak nerozumí, pouze v sérii prediktivních úloh rozpoznává povědomé sekvence dat v n-dimenzionální matrici, které se *učí* více nebo méně věrohodně řetězit - je koženkovou imitací, mechanickým Turkem lidského porozumění, paměti a jazyka. Je zcela stochastický: anatomii, harmonii ani princip operace 2 + 2 = 4 nechápe, pouze předvídá nejpravděpodobnější výsledek. Nemá konzistenci ani skutečnou paměť, nedokáže abstrahovat - velmi omezenou kreativitu pouze napodobuje. Trénuje se jednorázově (odtud akronym: Generative Pre-trained Transformer) na masivním datasetu s bilionem parametrů.
Vaše čtyřletá neteř zřejmě nepotřebuje vidět 15 000 obrázků anotovaných tagy a parametry, aby dokázala nakreslit křečka. Naoplátku i hlodavec se sám naučí řídit a nepotřebuje k tomu zhlédnout petabajt kamerových dat.
Pokud se něco z univerzální lidské zkušenosti vůbec přibližuje strojovému učení, pak je to moment, kdy jste v páté třídě opisovali písemku z taháku: látce absolutně nerozumíte, pouze slepě důvěřujete hustě popsanému “datasetu”, hledáte spojitosti se zadáním, suverénně předstíráte porozumění a modlíte se, aby to prošlo. Je pak odevzdaný klíč výsledkem procesu učení?
„Lidská mysl není žádným těžkopádným statistickým strojem na rozpoznávání vzorců, který se láduje stovkami terabajtů dat a extrapoluje nejpravděpodobnější konverzační odpověď nebo nejpravděpodobnější řešení vědeckého příkladu. Naopak: lidská mysl je překvapivě efektivní a elegantní systém, který operuje s extrémně malým množstvím informací. Neusiluje totiž o pouhé odvozování korelací mezi datovými body, ale o pochopení a vysvětlení.
— Noam Chomsky, kognitivní vědec a lingvista
Proces lidského učení má navíc veledůležitý kulturní rámec a obsahuje nepsaný společenský kontrakt: vše, co nám společnost přímo i nepřímo předává, se zhodnocuje tím, co do ní obratem sami vložíme, nabyté zkušenosti budeme dále sdílet a každý vzdáleně odkoukaný motiv či odposlechnutá melodie obohatí skrze nás korpus lidského života a poznání.
Žádný sociální kontrakt strojové učení nezná: v podání většiny populárních generátorů jde o vysokootáčkovou pračku na duševní vlastnictví, která jednosměrně agreguje profit, článek za paywallem přeformuluje nez uvedení zdroje a melodii, kterou si stáhne z vašich stránek, jen přeprodá v G dur freelancerovi na Filipínách za drobný měsíční paušál.
Nezanedbatelný rozdíl hraje samozřejmě i čirá frekvence a měřítko: jedna věc je po letech čtení a mdlých literárních pokusů napsat knihu, která je v jistém velice přeneseném smyslu syntézou všech vašich předchozích čtenářských zkušeností; úplně jiný fenomén je nasát brčkem kompletní penzum historie literatury a internetu a co čtrnáct dní zpět vychrlit větší objem textu, než knihtisk za celou dobu své existence.
Uf, a je to! Nyní přistupme k zajímavější části jazykové.
Božský hodinář
Antropomorfizace je typicky semiotickým úskokem tech korporací, které se snaží normalizovat svůj produkt a získat pro něj míru přijetí a pochopení, jakou byste jinak projevovali lumpačícímu pejskovi. V širším kontextu jde ale o odvěký metaforický klam zvaný kategoriální chyba či morální literalismus:
Auta jsou mechaničtí koně. Na koních se jezdí. V autech se proto také jezdí.
Auta jsou mechaničtí koně. Koně žerou seno. Auta proto také žerou seno.— Crazy, right?
Na falešně hrající analogie tohoto typu odmítnul tancovat už skotský filozof David Hume. Ve své knize Dialogy o přirozeném náboženství si vyřizuje účty se řadou domnělých důkazů boží existence, které vycházející z chybné logické indukce: připomíná-li svět sám dobře seřízené hodinky, jistě i řád a složitost vesmíru naznačují existenci pečlivého božského “hodináře”…? Not!
Vítr šeptá, kniha vypráví, konvice píská a město nikdy nespí
AI modely se tak “učí” přesně do míry, s jakou motor “běží” či kamera “vidí”. Šlo by analogicky dovozovat, nakolik spalovací motor napodobuje lidskou biomechaniku a metabolismus, je ovšem stěží představitelné, že svůj dvojtaktní moped přihlásíme na atletický meeting v běhu na 800 metrů. Nebo že do kina proneseme videokameru na stativu s odůvodněním, že přeci pouze “sedí a kouká” jako my ostatní a jediné, co zbývá, je jí koupit lístek.
Magii lyrických metafor navzdory se prostě mnohé věci podrobují přísné regulaci: telefon volá a pes sedí, ovšem z pádných důvodů jsou na mnoha místech přísně zakázáni. Jinými slovy: i kdyby byl zdrojem hlubokého učení dokonalý bionický mozek, který naprosto věrně replikuje každý jeden proces učení lidského, i tehdy by bylo naprosto legitimní jej regulovat, čistě kvůli etickým, ekonomickým nebo environmentálním implikacím, jaké má pro naši společnost.
Dalším krokem úspěšné antropomorfizace technologií je totiž předstírání, že jsou součástí přirozeného a odvěkého pořádku. Je-li ovšem strojové učení lidským učením, je klonování lidí obdobou lidského početí. Asi málokdo by přitom souhlasil, že klonování či GMO je vhodné deregulovat v zájmu firemních úspor.
Spolu s jadernou bombou - radiace je koneckonců v každém banánu.






