Hlavní obsah

Schopnosti AI rostou exponenciálně. V čem spočívá výhoda lidí?

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Většina lidí nemá šanci postřehnout, že zatímco rozhraní chatbotů zůstává víceméně stejné, na pozadí se odehrály klíčové změny.

Před třemi lety uměl chatbot odpovědět jen na základní otázky. Nyní si na počkání poradí s úkoly, které trvají profesionálům celý den. Cena navíc klesá, což umožňuje zapojit AI do agentní smyčky. V čem mají lidé stále navrch?

Článek

Proč vlastně píšu tento článek? Takové otázky si budeme klást stále častěji. V době, kdy může AI na přání vytvořit celou analýzu, knihu nebo aplikaci, totiž ještě více záleží na tom, co se my lidé rozhodneme dělat se svým časem.

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Pro mě to třeba znamená, že si pečlivě vybírám témata, kterým se věnuji. Beru to jako službu vám, čtenářům: Nechci psát o hloupostech, jakkoli by se o nich psalo snadno a třeba by se to i pěkně četlo.

Tento týden třeba nepíšu o tom, jak člověk bez lékařských zkušeností vyléčil rakovinu svého psa pomocí ChatGPT jen za pár tisíc pomocí vakcíny na míru. Nebudu o tom psát, protože se to takto prostě nestalo: Nebylo to jen pár tisíc, neudělal to sám a žádný lék na rakovinu tím neobjevil. A navíc se to celé odehrálo už v roce 2024. Ale posledních pár dní je toho příběhu všude plno.

Nebudu psát ani o fascinujícím příběhu vědců, kteří údajně neuron po neuronu zkopírovali mozek octomilky a pak ji oživili v počítači. Záběry „vzkříšené“ mušky poletující ve virtuálním prostoru se virálně šíří na sociálních sítích i v televizních reportážích. Znamená to, že jsme o kus blíže nakopírování lidského mozku do počítače? Spíše ne, respektive není vůbec jasné, co se týmu z kalifornského startupu skutečně povedlo. Je dost možné, že dělají z octomilky velblouda.

Místo toho budu psát o třech grafech. Věřím totiž, že je to v tuto chvíli to nejdůležitější, co se ohledně AI děje. Jeden měří, jak složité úkoly už AI zvládá. Druhý, kolik to stojí. A třetí zkouší zachytit, jak umělá inteligence dopadá – a případně může dopadnout – na různé profese. Dohromady nastiňují příběh, který se nedá vměstnat do jednoho titulku.

Umělá inteligence se zlepšuje exponenciálně

Na první pohled se může zdát – a vůbec nikomu nevyčítám, že to tak vnímá –, že se v oblasti umělé inteligence od uvedení ChatGPT v listopadu 2022 nic moc nezměnilo. Přibylo sice chatbotů (Gemini, Claude, Grok, Copilot, Perplexity…), ale všechny se navenek velmi podobají tomu, s čím tehdy přišla firma OpenAI.

Většina lidí nemá šanci postřehnout, že zatímco rozhraní zůstává víceméně stejné, na pozadí se odehrály klíčové změny. Velké jazykové modely (LLM), které tvoří motor těchto chatbotů, se od roku 2022 posunuly na úplně novou úroveň. Změřit inteligenci není jednoduché ani u lidí. U počítačů jsou pak výsledky testů inteligence prakticky neuchopitelné. Navíc jsou často shora omezené: Pokud někdo sestaví test, ve kterém AI získá 60 bodů v roce 2022 a 95 bodů v roce 2025, co to znamená?

Foto: Pavel Kasík

Tato konverzace s ChatGPT z prosince 2022 by se klidně mohla odehrát i dnes.

Proto se mi líbí graf neziskové organizace METR, která poměřuje schopnosti AI pomocí poměrně představitelné metriky. Napřed nechali lidi – obvykle odborníky v nějakém oboru, například informatice – plnit různě obtížné úkoly a sledovali, jak dlouho jim to trvalo. Dohledat odpověď na jednoduchou otázku na Wikipedii (jedna minuta), naprogramování jednoduchého skriptu v Pythonu (jedna hodina) až třeba po napsání komplikovaného nástroje pro optimalizaci aplikace (osm hodin).

Stejné úkoly pak dostanou od posuzovatelů i AI nástroje. Pokud daný model splní (vyřeší) takový úkol alespoň v polovině případů, lze o něm říci, že jeho výkon je ekvivalentem lidského snažení pro daný „časový horizont“.

V roce 2022 zvládla nejlepší umělá inteligence (GPT-3.5) úkoly, které člověku trvají do jedné minuty. Když jsme o METR grafu psali poprvé, dominoval mu Sonnet 3.7, u kterého naměřili ekvivalent hodinového lidského soustředění. A nyní, o necelý rok později, jsme na neuvěřitelných 12 hodinách.

„Časový horizont toho, co modely dokážou zvládnout s 50% úspěšností, roste exponenciálně od roku 2019 do roku 2025,“ všímají si výzkumníci. Tento časový horizont se zdvojnásobuje každých sedm měsíců. Poslední dobou navíc tempo zrychluje a organizátoři museli navýšit počet dlouhých úkolů, aby mohli zachytit, jak se schopnosti AI razantně vylepšily. Připomeňme, že časová hodnota neudává, jak dlouho na úkolu pracovala umělá inteligence, ale jak dlouho by na takovém úkolu musel pracovat člověk.

Pokud jste si udělali o umělé inteligenci představu v roce 2023, 2024 nebo na jaře 2025, budete mít tendenci řádově podceňovat, čeho všeho jsou aktuální AI systémy schopné. V roce 2023 za vás chatbot napsal e-mail se zdvořilou omluvou, proč se projekt zpozdil. V roce 2025 pro vás napíše aplikaci pro týmovou spolupráci na projektu. Co zvládne na konci roku 2026?

Smyčka produktivity za hubičku

Exponenciální křivka se vyznačuje tím, že v kterémkoli momentu vypadá, že se zrovna nedávno zlomila a „utrhla z řetězu“ směrem vzhůru. Za nedávný skok ze čtyřhodinových úkolů v létě 2025 na dvanáctihodinové v únoru 2026 ale paradoxně může skutečnost, že vývojáři našli lepší řetězy k zapřažení AI modelů. Někdy se tomu říká „lešení“ (scaffolding) nebo „postroj“ (harness).

Jde v podstatě o naplnění predikce ze začátku roku 2025: Namísto AI chatbotů si slovo berou AI agenti. Správným zapojením a zřetězením se podařilo „zacyklit“ umělou inteligenci tak, aby na nějakém úkolu dokázala pracovat déle.

Když udělá chybu – a to AI systémy dělají dost často –, tak si toho všimne a má k dispozici nástroje, pomocí kterých může chybu ověřit a opravit. Není náhodou, že nejvýznamnějšího pokroku si v posledním půlroce všimli programátoři. Nástroje jako Claude Code (ve kterém funguje i výše zmíněný Opus 4.6) totiž umožňují uzavřít AI model do produktivní smyčky.

„Ještě nedávno jste tenhle pojem vůbec nepotřebovali,“ vysvětluje Ethan Mollick, profesor inovací na University of Pennsylvania. „AI model byl ten hlavní produkt, ta hlavní služba. Role smyčky byla minimální. Ale nyní opravdu záleží na tom, do čeho model zapřáhnete.“

Třeba zmíněný Claude Code, který je na trhu od února 2025, ale do masového povědomí se dostává až v posledních měsících. Uživatel napíše nebo nadiktuje zadání. Model navrhne řešení. Uživatel odpoví na několik otázek a systém se pustí do práce. Umí si zavolat různé nástroje. Dokáže se podívat na výsledek své práce, a pokud neodpovídá zadání, pustí se do práce znovu. Může tak odhalit své chyby a vyzkoušet klidně i desítky alternativních cest, než dorazí k výsledku.

Foto: Pavel Kasík

Aplikace Claude Code mate tělem. Běží v terminálu, ale umí pracovat s prohlížečem, obrázky a delegovat úkoly na agenty a sub-agenty.

Nebavíme se tedy o jedné konverzaci s chatbotem. Ta by se totiž odehrávala rychlostí lidské komunikace. Člověk ale může jít na procházku, zatímco hejno agentů bude na úkolu pracovat. Celkově může jít o stovky stránek konverzace, kterou člověk nikdy nemusí číst. Není určena lidským očím, ale agentům. A když je hotovo, blikne vám na mobilu notifikace, že je výsledek připravený.

Produkce takového množství textu by byla ještě nedávno neuvěřitelně drahá. Udělal jsem si pár hrubých odhadů a k naprogramování nějaké menší aplikace spotřebuje Claude Code třeba 100 000 tokenů. To je v angličtině přibližně 75 000 slov, tedy asi jedna kniha Harry Potter a kámen mudrců. Vyprodukovat tolik tokenů LLM by v roce 2023 pomocí tehdejších kapacit stálo asi 200 korun. Nyní se cena stejného množství stránek snížila na přibližně korunu.

Vidíme tedy další prudce se měnící křivku, kde se za tři roky cena posunula o dva řády dolů, ze stovek korun na jednotky. Opět něco, co není na první pohled pro uživatele evidentní. Vždyť předplatné za chatboty je pořád stejně drahé. Na pozadí ale AI agenti „propálí“ mnohem více textu než dříve. Něco padne na vyhledávání, něco na úkolování sub-agentů, něco na přemýšlení (reasoning). Výsledkem je, že cena klesá a výkon stoupá.

V práci zatím (skoro) vše při starém

Vraťme se ale ze světa exponenciálních křivek zpět na zem. Firma Anthropic analyzovala, jak umělá inteligence „zasáhla“ do různých profesí. Vychází přitom ze svých anonymizovaných dat o tom, co lidé s chatbotem řeší, a porovnává to s „teoretickou možností náhrady“ v daném oboru.

Vycházejí z metriky, která se týká čistě a jen toho, jak by do daného oboru teoreticky mohl zasáhnout jazykový model (LLM). A tak zatímco u překladatelů odhaduje „hrozbu náhrady“ na vysokou, u zedníků nebo řidičů na nulovou.

Takové žebříčky jsou samy o sobě dost zjednodušené, ale to teď nechme stranou. Podstatné je, že ze zjištění firmy Anthropic vyplývá, že skutečné zapojení umělé inteligence do praxe je nyní velmi nízké, a to i v oborech, kde je potenciál k zapojení teoreticky vysoký.

Ačkoli data v některých oborech ukazují zpomalení nabírání juniorních pracovníků, zatím se umělá inteligence měřitelně nepromítla na nezaměstnanosti. To sedí i na pozorování týmů Scale LabsMercor, jejichž analýzy ukazují jen velmi malou úspěšnost jazykových modelů při samostatném plnění reálných úkolů.

Ostatně i zmiňovaná METR metrika dosáhla na 12hodinový horizont jen tehdy, když se výzkumníci spokojili s poloviční úspěšností při řešení daného problému. Kdybyste své požadavky zvýšili a chtěli po AI 80% úspěšnost, tak najednou schopnosti nejlepšího modelu Claude Opus 4.6 násobně klesnou, až k jedné hodině deseti minutám.

Stále je to zkrátka v praxi příliš křehká chytristika. Tam, kde lze zadání jasně definovat a výsledek automaticky ověřit, lze tuto křehkost kompenzovat právě skrze zmíněné agentní postroje. Ale většina oborů není takto plně automaticky verifikovatelná a zároveň stoprocentně digitalizovaná. Struktury jsou optimalizované na lidské pracovníky, a to nám jako lidem dává trochu času.

Problém je, že graf se zapojením AI do praxe lze číst dvěma radikálně odlišnými způsoby. Někdo v něm vidí utopii: „Podívejte se, jsme teprve na začátku, umělá inteligence má stále kam růst.“ Zatímco skeptik si stejné hodnoty vyloží právě opačně: „Strašili nás tím, že přijdeme o práci, a realita ukázala, že ani náhodou.“ Každá skupina se upevní ve svém přesvědčení a rozumné debatě o možnostech a rizicích AI nejsme ani o token blíže.

Pěna AI dní

Umělá inteligence je už tři roky v centru mediální pozornosti. A pro novináře i čtenáře je samozřejmě lákavé chytat se fascinujících jednotlivostí: Nová verze modelu, přelomová studie, kdo koho pomocí AI podvedl a co zase chatbot zkazil nebo spletl. Takové články obvykle dávají iluzi toho, že jsme se dozvěděli něco významného, ale přitom nabízejí jen nepatrný (a často zcela okrajový) střípek.

Skutečnou změnu nemohou zachytit a dávají nám místo toho prostor k tomu, abychom si v článku našli, co potřebujeme. Jak napsal Terry Pratchett: „Lidé nechtějí číst novinky. Lidé chtějí číst to, co už vědí. Lidé si myslí, že chtějí novinky, ale přitom touží po tom, aby vše zůstalo při starém.“

Pamatuji si to z doby, kdy jsem začínal psát o internetu, což byla v roce 2005 pořád taková podivná kuriozita. Byly to třeba články jako „Vyšla nová verze Firefoxu“ nebo „Existuje web, kde dohledáte počet kalkulaček na dítě v každé zemi světa“. Viděno zpětně to rozhodně nebyly ty nejdůležitější věci, které se tehdy odehrávaly.

Vždyť se tehdy začínaly psát dějiny polarizované, algoritmy prodchnuté společnosti, YouTube proměnil přístup ke kultuře, knihkupectví Amazon se nenápadně stalo hlavním provozovatelem cloudových služeb, lidé si začali zvykat na chytré mobilní telefony… Jenže když o tom někdo psal jako o „civilizačních otázkách“, působil jako podivín.

A také nyní se nastavují společenské a regulační rámce toho, jak bude vypadat soužití lidí a umělé inteligence za deset let. O AI se sice diskutuje, ale přijde mi, že si lidé často vybírají fakta podle toho, jaký názor si potřebují potvrdit. Když si chce někdo upevnit představu, že je umělá inteligence jen „papoušek bez mozku“, nemá problém najít halucinacechyby. Když někdo naopak chce ukázat ohromnou sílu AI, odkáže na případy, kdy modely překonávají výkon lidí.

Rád bych přispěl k informované debatě, ale mám pocit, že od roku 2023 pořád řešíme ty stejné otázky: Je to vůbec inteligence, když jsou na pozadí jen jedničky a nuly? Dá se mluvit o kreativitě, když AI nikdy nepocítila radost nebo strach?

Proč by vám měl někdo věřit?

Rád bych, kdybychom se z této fáze posunuli dál. Exponenciální růst je pro lidi nejen těžko pochopitelný, ale hlavně s ním nemůžeme soupeřit. Lidé se obvykle nezdokonalují exponenciálně, a tak si to neumíme ani představit, natož abychom s umělou inteligencí v tomto ohledu mohli soupeřit. Pokud zakládáte svou hodnotu v práci na tom, že „vy umíte přemýšlet, zatímco AI jen papouškuje“, vsadili jste na špatnou kartu.

Pak se vás totiž někdo zeptá: „Kolik vlastně pro nás za den produkujete přemýšlecích tokenů?“ A vy budete v závodě, který člověk nemůže vyhrát, stejně jako člověk nemůže soupeřit co do rychlosti a nosnosti s nákladním vlakem.

Co můžeme jako lidé nabídnout? Zatím se zdá, že naší výhodou může být důvěryhodnost a odolnost. Jsme schopni věci dotahovat, i když nad námi nikdo zrovna nestojí a nekontroluje nás. Umíme odhadnout své schopnosti a ostatním lidem dát slib: Bude to hotové, za to ručím. Umíme si budovat důvěryhodnost a nabízet ostatním své slovo.

A když nám ostatní věří, můžeme je přesvědčit k něčemu, co by chatbota ani nenapadlo. Pořád totiž máme ve vztahu k ostatním lidem pouto sounáležitosti. ChatGPT umí vygenerovat recepty na míru a výsledky jsou obvykle dobré. Ale jedině člověk mě přesvědčí, abych zkusil recept, který mi na první pohled přijde nesmyslně náročný. Slovo toho člověka, „zkusil jsem to na vlastní pěst a stojí to za to“, je pro mě víc než pokročilá agregace všech psaných dokumentů světa.

Co nabízí člověk navíc oproti AI?

Sestavili jsme přehled deseti věcí, které umělá inteligence (v březnu 2026) neumí nabídnout.

Některé tyto lidské výhody jsou subjektivní, jiné mají obecnější platnost. Některé jsou přímým důsledkem právního postavení lidí, další vycházejí z lidské smrtelnosti a individuality. A v něčem zkrátka lidé chtějí věřit ostatním lidem, právě proto, že jsou také lidmi.

Důvěryhodnost si ale u ostatních nevybudujeme tak, že jim budeme říkat „nevěřte stroji, stroj neumí přemýšlet a není kreativní“. Tím jen ukážete, že jste nepochopili, jak rychle se AI zlepšuje. Umělá inteligence dosahuje reálných výsledků. Jejich popíráním si pouze lžeme do kapsy a znesnadňujeme sobě i ostatním pochopit, co se skutečně děje.

Pokud budeme s vlakem závodit, tak padneme vyčerpáním. Místo toho je čas postarat se o to, abychom koleje postavili způsobem, který nám lidem bude sloužit, místo aby nás ničil.

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Doporučované