Hlavní obsah

Dlouhý text už snadno vyrobí každý. Čím dokázat své schopnosti v éře AI?

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Dlouhý text v éře AI není důkazem pečlivě odvedené práce. Čím ostatním lidem dokážeme, že nám můžou věřit?

Jak zareagujete, když od někoho dostanete dlouhý e-mail nebo velmi podrobnou odpověď v textové zprávě? Nejspíš jinak než před několika lety. Zvykáme si na novou situaci a mění se i význam signálů, které vysíláme do okolí.

Článek

Vždycky jsem rád psal dlouhé e-maily. Už od roku 1998, kdy jsem si e-mail založil, jsem si dával záležet na tom, aby moje zprávy měly hlavu a patu, aby rozebraly vše, co bylo potřeba, a ideálně aby byly nějak vtipné nebo výjimečné. Zkrátka aby příjemce viděl, že mi na nich záleží.

Ještě větší radost jsem měl, když si někdo dal práci a napsal dlouhý dopis nebo e-mail mně. Bral jsem to jako doklad vzájemného respektu a přátelství. Někdo mi věnuje svůj drahocenný čas a já mám teď možnost těšit se z výsledku. Jistě, také jsem zakusil, jaké to je číst e-mail od grafomanů, delší neznamenalo vždy lepší. Ale i to typické „mlácení prázdné slámy“ se s trochou praxe dalo poznat na první pohled a člověk pak automaticky ze zaujatého čtení přepnul do netrpělivého přelétávání odstavců.

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Postupně jsem si vypěstoval instinkt: Už jen ze struktury textu na obrazovce, z délky odstavců nebo třeba z empaticky formulovaného předmětu jsem poznal, kolik úsilí pisatel tvorbě věnoval. A podvědomě jsem se těšil, co se dozvím. Možná právě proto, že jsem věděl, že dát dohromady srozumitelný, dlouhý a dobře strukturovaný text není jen tak.

Smysluplný text umíme poznat z dálky. Je to jedna ze schopností, kterou si každý čtenář musel vyvinout. A protože víme, že sepsat text vyžaduje usilovnou práci, používáme „dlouhé smysluplné texty“ jako zástupné měřítko dalších věcí, které tak snadno měřit neumíme.

Motivační dopisy často hrají roli při výběru kandidáta, seminární práce ve školách jsou pro učitele dokladem studentova úsilí a dobře napsaný grant rozhoduje o tom, kam půjdou peníze ze státních i soukromých prostředků. Velká část naší civilizace je postavená na tom, že posuzujeme něčí texty.

Umělá inteligence umí napodobit naše signály

Určitě tušíte, kam tím směřuji. Dodnes si pamatuji, jak jsem fascinovaně sledoval, s jakou rychlostí za sebe velké jazykové modely sází slova a dávají dohromady věty a odstavce. Poprvé jsem to zažil s GPT-3, který byl přístupný ve vývojářském prostředí. Tento model nebyl tak schopný jako dnešní generátory textu, ale už tehdy mi přišlo, že v samotném psaní textů je lepší než většina vysokoškolských studentů.

Foto: Pavel Kasík, Seznam Zprávy

Takto vypadaly výsledky GPT-3.5, prvního jazykového modelu použitelného v češtině.

S uvedením ChatGPT koncem roku 2022 generativní umělá inteligence vstoupila do obecného povědomí. Počet uživatelů rostl. Texty vytvořené AI byly najednou všude. A délka textu, jeho srozumitelnost nebo smysluplná struktura přestaly být důkazem, že je za odstavci skutečná lidská práce.

Dokonce bych řekl, že kolem roku 2024 se to začalo obracet. Když jsem viděl, že mi někdo poslal dlouhý text – obzvláště patrné to tehdy bylo na sociálních sítích –, bylo pravděpodobnější, že jde o výplod umělé inteligence.

Jazykové modely navíc netvoří jen tak nějaké texty. Jsou vytrénované k tomu, aby tvořily texty, které působí důvěryhodně. I ty nejlepší AI modely stále občas halucinují. Ale i ty halucinace jsou čím dál důvěryhodnější. Umožňují jim to přesně ty signály, které jsme se celý život učili z dálky rozpoznávat.

Odstavce jsou podobně dlouhé a logicky uspořádané, ideálně proložené srozumitelnými nadpisy. Sem tam jsou v textu stručné odrážky. Tvrzení bývají vyvažována, aby bylo vidět, že pisatel není radikální, ale snaží se naopak být intelektuálně férový. Tón přesto bývá autoritativní, uklidňující, sebevědomý. A aby nebyl nikdo na pochybách, vše je podloženo několika příklady. Skoro vždy přesně třemi.

Vygenerovaný text je zkrátka vždy oblečen do profesionálního a důvěryhodného kabátu. Bez ohledu na to, zda je skutečně podložen reálnými informacemi. Vysílá všechny signály, které očekáváme od důvěryhodného textu. A naše dlouho budované instinkty teď jdou proti nám.

Jako kdybychom celý život posuzovali zralost banánu podle jeho žluté slupky. A teď prodejci vyšlechtili banán, který má perfektně žlutou slupku bez ohledu na zralost dužiny uprostřed. Signál ztratí svůj význam. Bude chvíli trvat, než si na to zvykneme. A v tom mezidobí asi občas kousneme do věcí, které nebudeme chtít polknout.

Slovo od slova

Velký problém vidím zejména v tom, že na textu  – a jeho posuzování – je založena velká část naší moderní civilizace. Zákony, žádosti, odvolání, referáty, stížnosti, motivační dopisy, smlouvy, webové prezentace… To všechno jsou vodítka, která denně používáme, abychom dali věcem a světu nějaký řád a abychom se v něm zorientovali.

Učitelé to zaznamenali jako první. Velká část středoškolského a vysokoškolského vzdělávacího systému spočívá v tom, že žáci a studenti píší texty a učitelé je posuzují a komentují. Cílem ale nikdy nebyly samotné texty. Nepotřebujeme ostatně každý rok desetitisíce nových referátů o Karlově mostu. Ale máme zájem na tom, aby se studenti naučili pracovat se svou pozorností, čerpat informace z více zdrojů a dotahovat do konce zadaný úkol. To jsou schopnosti, které učitel hodnotí, a text referátu je jen odrazem toho, jak se student zlepšuje a v čem případně potřebuje pomoci.

A nyní, prakticky ze dne na den, dostali všichni studenti na světě možnost texty generovat. Zadarmo, rychle a velmi pohodlně. Učitelé často odhalí, že jde o generovaný text, a tak se studenti učí tyto detektory obcházet. Dalo by se tedy cynicky říci, že nějaké schopnosti získávají. Učí se vysílat signály, které jsou jejich učitelé naučení rozpoznávat. Ale původní účel se rozpadl.

Podobně jsou na tom motivační dopisy, grantové žádosti nebo weby. Po celém světě lidé zjišťují, že je pro ně výhodnější tyto texty generovat pomocí AI, než aby se s nimi psali ručně. Výsledné texty na první pohled vysílají ty správné signály. A my se začínáme učit, že když nějaký text vysílá správné signály, je to vlastně podezřelé.

Perfektně a srozumitelně sepsaný e-mail už na nás najednou působí nedbalým dojmem. „To zjevně vyprodukoval na jeden prompt,“ odfrkneme si. Zatímco dvě věty, z toho jedna má špatně čárku a ve druhé je překlep… To je od ní hezké, že si s tím dala takovou práci!

Význam signálů se obrací proti profesionálům

V případě textových informací už si lidé zvykli, že dlouhý strukturovaný text je obvykle indikací strojového původu. Někdy z textu AI vysloveně odkapává, jindy to člověku dojde až po pár odstavcích.

Já se přiznám, že nejvíc mě tento rozpad signálů mrzí u žánru infografiky. Od malička jsem zbožňoval kvalitní infografiky, které dopodrobna pitvaly nějaké téma. Některé knihy mám dodnes schované. Oceňoval jsem, že jde o výsledek podrobné práce, pravděpodobně celého týmu lidí. Odbornice připravila podklady, redaktorka je upravila a vymyslela metafory, ilustrátorka dodala vizuální podobu a editorka to pak kompletovala.

Dobře připravená a vizuálně poutavá infografika pro mě byla ještě před třemi roky zárukou toho, že si s tím někdo dal práci a že tedy nebudu litovat času, který strávím studiem jednotlivých kolonek. Když se do toho opravdu ponořím, budu odměněn nejen lepším pochopením tématu, ale třeba i nějakými drobnými vizuálními vtípky, které někteří autoři do ilustrací rádi schovávají.

Foto: Amazon.com / Randall Munroe

Vysvětlovací kniha How it works od Randalla Munroea je moje oblíbená právě proto, že autor kombinuje zajímavé vizuální nápady s rozmyšleným zjednodušováním až k jádru věci.

Infografiky nějakou dobu odolávaly snaze o generování. I počátkem roku 2024, kdy umělá inteligence zvládala vytvářet obrázky lidí k nerozeznání od fotografií (viz náš kvíz z ledna 2024), byly pokusy o generování grafiky legračně neúspěšné.

Ale nové generátory od Google a OpenAI už jsou na základě jednoduchého zadání schopné vytvořit infografiky, které jsou na první pohled k nerozeznání od těch profesionálních.

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Toto schéma vyrobil ChatGPT. Na první pohled vše sedí, čím podrobněji si generát projdete, tím více podivných maličkostí objevíte.

Při bližším zkoumání najdete celou řadu nesrovnalostí. Ale na první pohled působí infografika použitelně, skoro bych se nedivil, kdyby ji nějaký nepozorný učitel vyvěsil ve třídě na nástěnku.

To mi ostatně podobné generáty připomínají nejvíce: kulisy do filmu. Věci, které budou na obrazovce jen pár sekund, nemají za cíl nás vzdělat, jen nám dát dojem, že jsme viděli něco skutečného. Když záběr pozastavíte, můžete se bavit nepřesnostmi.

Čím dál lepší „infografiky“

S tím, jak se infografiky generované umělou inteligencí zlepšují, už ten rozdíl přestává být jasně patrný. Já jsem třeba teď strávil opravdu hodně času přípravou článku o stoupající frekvenci horkých dní: podívejte se na článek s interaktivními grafy. Umělou inteligenci jsem zapojil jako pomocníka při programování interaktivních prvků, zajistil jsem samozřejmě, že čerpá z reálných a oficiálních dat.

Foto: graf: Pavel Kasík, Seznam Zprávy

Snímek mého grafu (v původním článku je interaktivní a lze přepínat mezi více městy).

Jenže když někdo nadá pokyn do chatbota, dostane infografiku, která na první pohled říká to samé. Stačil k tomu přitom jednoduchý prompt: „Udělej ilustrační infografiku, která ukazuje, jak se v Praze zvedla frekvence maximálních teplot během léta. Udělej to jako ukázku posunu histogramu.“

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Grafika od Gemini 3.5, nejde o reálná data (žluté varování jsem do obrázku doplnil ručně já).

Problém je, že tyto grafy vůbec nevycházejí z nějakých reálných měření. Prostě to generátor odhadl. Nejde o graf – v tom smyslu, že graf je převedení skutečných čísel do grafické podoby – ale o náčrtek, o vizualizaci dojmu. Tedy vlastně pravý opak toho, co člověk od „infografiky“ právem čeká.

Čím déle se na infografiku budete dívat, tím více chyb najdete. Ale jako „kulisa“ pro přednášku asi někomu bude stačit. Všímám si, že podobných „grafů“ se teď objevuje čím dál více.

Zatímco dříve byla povedená, vizuálně zajímavá infografika jasným signálem „tady si někdo dal opravdu záležet“, brzy to bude na lidi naopak působit jako indikace, že někdo dal chatbotovi stručné zadání a zkopíroval výsledek. Paradoxně tím utrpí i profesionálové, kteří umí infografiku připravit „ručně“. Výsledek jejich pečlivé práce bude na první pohled lidi odpuzovat, pokud se naučíme, že infografik generovaných umělou inteligencí je všude plno.

Budeme požadovat důkaz vynaloženého úsilí?

Nejde o to, že se mění jedna oblast lidské práce a my na to musíme reagovat. Problém je, že se mění skoro všechny oblasti, a to velmi rychle. Nedostáváme moc času si na nové signály zvyknout a všichni si musíme za běhu vytvářet nové instinkty.

Dřív jako důkaz vynaloženého úsilí sloužil samotný text. To nyní padlo a se stoupajícími schopnostmi AI postupně padají i další žánry. Umělá inteligence už dokáže napodobit vzhled profesionálního dokumentu, excelového sešitu, vědecké práce, infografiky nebo prezentace. Umí generovat videa s mluvícími hlavami a napodobovat influencery, kteří nadšeně recenzují neexistující zboží. Jestli vás napadá nějaký formát, který je před AI dlouhodobě v bezpečí, sem s ním.

Foto: Pavel Kasík, Seznam Zprávy

Ještě nedávno neuměli chatboti tvořit profesionálně vypadající dokumenty. Ale i to už se naučili tak, že překonávají člověka, co si dá „schopnost pokročilé práce s MS Office“ do životopisu.

Dodal bych také, že ne všude potřebujeme skutečnou lidskou pozornost. Postupně zjistíme, že někde nám skutečně stačí, když práci odvede AI, pokud bude možné výsledky nějak ověřit nebo se za ně jinak zaručit. Ale budeme muset najít nové signály, jak tuto důvěryhodnost komunikovat směrem ke čtenáři.

Já si třeba u sebe všiml, že mnohem více dávám pozor, kdo je autorem textu, který čtu. Dříve jsem si skoro zakládal na tom, že se nedívám na autora nebo hlavičku média, ale posuzuji každý text podle toho, jak je napsaný a ozdrojovaný. U studentských prací jsem dokonce jméno ze seminárek automatizovaně odstraňoval, abych se vyhnul tomu, že bych někomu stranil jen na základě toho, že jejich jméno znám z přednášek.

Jenže teď si uvědomuji, že chci číst texty od lidí, u kterých mám nějaký důvod jim věřit. Nemám tolik času, abych mohl číst stovky vygenerovaných stránek. Chci články od autorů, kteří si váží svého i mého času. Chci studovat analýzy a infografiky od tvůrců, u nichž vím, že by jim profesní čest nedovolila plýtvat pozorností čtenáře, a že za každým jejich grafem jsou hodiny pečlivé práce.

Na vysokých školách nebo u příjímacích pohovorů často nastává návrat ke klasickým nástrojům: přítomnost v jedné místnosti, křída a tabule nebo tužka a papír. A ukaž, co umíš. Možná bude právě ta fyzická přítomnost známkou a zárukou luxusu. Značka „BIO“ kvality, důkaz toho, že práci skutečně odvedl člověk. Otázka – pro mě prozatím bez jasné odpovědi – je, zda budou ostatní ochotni za tuto známku lidskosti platit.

Jak AI promění naši důvěru

V éře dostupné generativní umělé inteligence se rozpadají signály, pomocí kterých jsme dříve odhadovali, nakolik můžeme ostatním lidem věřit. Co s tím uděláme?

Jinou paralelou nám mohou být „rodokmeny“, průvodní listy u originálních výrobků nebo léků, které mají zajistit, že nedošlo k falšování. Já osobně v poslední době experimentuji s tím, jak zajistit, že výstupy od umělé inteligence jsou natolik ověřitelné, že se na ně mohu spolehnout. Není to jednoduché. Ve chvíli, kdy člověk potřebuje nejenom kulisy, ale něco, o co se může opravdu opřít, nemůžeme dát jen na první signální.

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Doporučované