Hlavní obsah

Google oplatil sokovi tři roky staré leknutí. Kdo je teď „nejchytřejší“?

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Závod mezi nejlepšími chatboty je velmi vyrovnaný. Napřed byl pod tlakem Google, nyní vyhlásila poplach OpenAI.

Tři roky po svém uvedení je ChatGPT stále „nejchytřejším“ modelem. Ale už to není o parník, spíš o chlup. Google zpočátku nastupoval pomalu, ale v posledních měsících se Gemini dostal do čela. Proti konkurenci má několik výhod.

Článek

„Představujeme nový model GPT-5.2, náš zatím nejsilnější model pro profesionální práci,“ oznámila firma OpenAI 11. prosince, jen den před svými desátými narozeninami. Nová verze – postupně zpřístupňovaná všem uživatelům ChatGPT – vykazuje výborné výsledky napříč různými testy.

Zlepšení by měli zaznamenat především programátoři nebo lidé pracující na složitých problémech. Pro většinu uživatelů – kteří si nechávají od chatbota vyhledávat dárky nebo překládat e-maily – bude posun sotva pozorovatelný.

Výsledky v podobných testech zdaleka nejsou to jediné, na čem záleží. Pro vedení OpenAI je to ale důležitý úspěch. Tři roky od uvedení první verze ChatGPT v listopadu 2022 si totiž může šéf OpenAI oddechnout, že je stále na špičce. Zatímco první dva roky to bylo vítězství téměř bez vyzyvatele, letos se OpenAI probojovalo do čela jen tak tak.

Dva velké poplachy

Začátkem prosince roku 2025 rozeslal Sam Altman, generální ředitel společnosti OpenAI, svým zaměstnancům interní memorandum. Jeho obsah byl stručný, ale o to závažnější: Altman vyhlásil „červený poplach“. Reagoval tak především na úspěšný model Gemini 3, který v polovině listopadu uvedla firma Google.

Nových verzí tzv. LLM (tedy velkých jazykových modelů) vychází několik do měsíce. Ještě v prosinci například Google stihl uvést rychlejší variantu Gemini 3 Flash. Ale verze Gemini 3 Pro byla něčím výjimečná. Nejenže se vyšvihla do čela všech možných žebříčků a tabulek. To je u nových špičkových modelů téměř povinnost. Ale i uživatelé – od kreativců přes programátory až po vědce – v následujících týdnech zahrnuli Gemini chválou.

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Nový model Gemini 3 Pro ve spolupráci s novým generátorem obrázků Nano Banana Pro si poradí i s úkoly, které byly dosud mimo možnosti chatbotů.

Což ostře kontrastovalo s přinejlepším vlažnými reakcemi uživatelů na srpnovou premiéru dlouho očekávaného, legendami opředeného modelu GPT-5 od OpenAI.

Další model OpenAI plánovala uvést až v prvním čtvrtletí 2026. Ale úspěch Gemini byl asi příliš zjevný. Na příkaz Altmana proto OpenAI okamžitě přeskupila síly, odložila plánované projekty týkající se reklamních systémů či nákupních agentů a veškeré zdroje soustředila na jediné – uvedení nového modelu pro ChatGPT.

Těm, kdo sektor sledují delší dobu, to přišlo jako déjà vu: Prakticky identický scénář se totiž odehrával před třemi lety, také v prosinci 2022. Jen to bylo v opačném gardu.

Tehdy management Googlu po vydání první verze ChatGPT bubnoval velmi podobnými slovy svůj vlastní „červený poplach“. Vládce internetového vyhledávání tehdy náhle působil jako dinosaurus, který si nevšiml přilétajícího asteroidu.

Ale vývoj ukazuje, že v technologickém byznysu zdaleka nestačí jen být první. Pokud chcete vyhrát maraton, potřebujete víc než jen rychlý start.

Když máte náskok, nemusíte pospíchat

Abychom pochopili současný obrat, musíme se vrátit do oné kritické zimy roku 2022. Google se tehdy ocitl v nezáviděníhodné situaci, kterou ekonomové nazývají „dilematem inovátora“. Společnost měla vlastní pokročilou technologii pro konverzační umělou inteligenci, nazvanou LaMDA (Language Model for Dialogue Applications), již vyvíjela několik let.

Něco velmi podobného dnešním chatbotům ukázal veřejnosti šéf Googlu už v roce 2021. Právě v laboratořích Google se ostatně do velké míry zrodila technologie „generativních předtrénovaných transformerů“ (to je to GPT v ChatGPT).

Foto: Arxiv

Legendární studie „Attention Is All You Need“ z roku 2017, ve které osm vývojářů (většina z nich z Google Brain) navrhlo vylepšený princip pozornosti, na kterém stojí i současné velké jazykové modely.

Google se za „společnost, kde se všechno točí kolem AI“, označil už v roce 2016. Firma různé varianty velkých jazykových modelů interně testovala už od roku 2017. Přesto je držela pod pokličkou. Důvod byl pravděpodobně čistě pragmatický. Google generuje drtivou většinu svých tržeb z reklamy ve vyhledávání. Pokud by uživatelům začal na jejich dotazy odpovídat přímočarým textem vygenerovaným chatbotem, lidé by přestali klikat na odkazy – a tedy i na reklamy.

Trochu to připomíná situaci v kdysi veleúspěšné firmě Kodak. Jeden z jejích techniků – Steven Sasson – už v roce 1975 zkonstruoval předchůdce digitálního fotoaparátu. Jistě, z dnešního pohledu to byl primitivní prototyp, pořizoval černobílé snímky s rozlišením „setiny megapixelu“.

Foto: George Eastman Museum

Steven Sasson pózuje se svým prototypem digitálního fotoaparátu z roku 1975.

Jenže vedení Kodaku usoudilo, že to poslední, co potřebují, je fotoaparát, do kterého se nemusí vkládat cívka s filmem. Právě prodej filmů a jejich vyvolávání totiž představovaly hlavní zdroj jejich příjmů. A tak byl patentovaný digitální fotoaparát odsunut na vedlejší kolej. Kodak promrhal svůj náskok a do učebnic ekonomie se zapsal jako firma, která se kvůli nástupu digitální revoluce dostala na hranu bankrotu. Přitom tuto revoluci mohla s náskokem odstartovat.

Google samozřejmě tuto chybu opakovat nechtěl. Bylo ale více důvodů, proč nejít s generativní umělou inteligencí na trh. Velké jazykové modely jsou nepředvídatelné a nespolehlivé. Mají tendenci si vymýšlet a sebevědomě kecat, tzv. halucinovat.

Svou roli zřejmě sehrál i incident z roku 2022. Programátor Blake Lemoine, který v Googlu pracoval na testování podobných pokročilých chatbotů, zalarmoval novináře s bezprecedentním tvrzením: V laboratořích Googlu se vyvinula „inteligence, která si uvědomuje sebe sama“. Firma jeho tvrzení rezolutně odmítla jako nepochopení a „antropomorfizaci“ textového generátoru. Z dnešního pohledu je zřejmé, že šlo o případ podobný intenzivním hovorům s AI, které svádějí uživatele do izolace a za hranu reality.

Tento případ, který svého času mocně rezonoval v médiích, mohl přispět k opatrnosti. Když ani profesionální vývojář nedokáže odlišit pravděpodobnostní generátor textu od „živé bytosti“, jak by na takovou službu reagovala veřejnost?

Král se probouzí

Když však OpenAI vypustila ChatGPT, Google se už dál nemohl rozmýšlet. Hrozilo, že promarní svůj náskok a uživatelé odejdou jinam. V sázce byla i prestiž v rámci neutuchajícího boje o talentované vývojáře.

Reakce v centrále v Mountain View byla intenzivní. Do firmy se vrátili její zakladatelé Larry Page a Sergey Brin, kteří se z řízení společnosti stáhli již v roce 2019. Nešlo jen o symbolickou podporu. Sergey Brin se podle dostupných informací znovu aktivně zapojil snad přímo do vývoje kódu.

Google navenek prezentoval své váhání jako chvályhodnou obezřetnost: „Zatímco někteří by chtěli tuto chvíli zúžit na pouhý závod o dosažení umělé inteligence, my to vnímáme jako něco důležitějšího. V Googlu do svých produktů implementujeme AI již více než deset let. To je důležité. Ještě důležitější je ale budovat umělou inteligence zodpovědně a zajistit, abychom jako společnost volili ty správné kroky,“ uvedl v květnu 2023 Sundar Pichai, šéf společnosti.

Souběžně s tím ale týmy zabývající se výzkumem AI dostaly jasný cíl: Vytvořit produkt, který dokáže konkurovat ChatGPT – i za cenu rizika, že technologie nebude dokonalá. Interní směrnice se změnily, ochrana reputace musela ustoupit nutnosti zůstat ve hře. Společnost začala testovat prototypy, které by dříve přes oddělení „důvěry a bezpečnosti“ nikdy neprošly.

První jarní den roku 2023 tak už Google oznámil svou odpověď na ChatGPT, chatbota jménem Bard. V prosinci téhož roku pak Google ukázal první verzi multimodálního modelu Gemini. Tedy modelu, který umí pracovat zároveň nejen se slovy, ale i s obrazem. Od počátku však jednotlivé premiéry provázely nejrůznější trapasy. Ukázalo se třeba, že ohromující demonstrace nových schopností Gemini byla ve skutečnosti „nafingovaná“, respektive dodatečně sestříhaná.

Foto: Google 2023

Když v prosinci 2023 Google ukázal výsledky svého Gemini Ultra, bylo skóre v MMLU (v té době nejpoužívanějším testu schopností LLM) velmi podobné těm od konkurenčního GPT-4 z června téhož roku.

Koncem roku 2023 lze tedy říci, že Google byl o půl roku pozadu za OpenAI. V následujících dvou letech tento náskok postupně doháněl. OpenAI ale vždy dokázala odpovědět silnějším modelem. Na Gemini 1.5 z února 2024 reagovala květnovým GPT-4.o. Když Google představil Gemini 2.5 v březnu 2025, o měsíc později přišel GPT-4.1.

Trumf „vlastního železa“

Jenže z pohledu běžného uživatele už rozdíly v „chytrosti“ nebyly prakticky patrné. Nejlepší modely od OpenAI, Anthropic, X.ai i Googlu už jsou natolik chytré a schopné, že pro většinu běžných úloh jsou všechny podobně dobré. Rozdíly jsou pak hlavně z hlediska použitelnosti. A tam má Google jednoznačnou výhodu, kterou jeho konkurenti – snad s výjimkou Microsoftu – nemohou v žádném případě dorovnat.

Google totiž není „jen“ firma dodávající chatbota. Je to především poskytovatel největšího vyhledávače na světě (přes pět miliard uživatelů). Dále provozuje „nadmiliardové služby“ jako YouTube, Gmail, Google Workspace a mobilní operační systém Android.

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Takto si svou „propojenou zahradu umělé inteligence“ představuje model Gemini. Vizualizaci vygeneroval nástroj NotebookLM od firmy Google.

Google nejenže smazal náskok konkurence, ale s modelem Gemini 3.0 ukazuje sílu, kterou mu dává jeho pozice třetí nejhodnotnější firmy světa. OpenAI má sice hodnotné spolupráce s dalšími megafirmami – především Microsoftem a Nvidií –, ale samotná firma má pouze tři tisíce zaměstnanců. Jen samotná divize Googlu zabývající se umělou inteligencí má dvojnásobek – a navíc zázemí celé firmy Alphabet s téměř 200 tisíci lidmi po celém světě v zádech.

V době AI nejsou důležití jen lidé, ale i hardware. A tam drží Google další důležitý trumf. Většina současného boomu umělé inteligence je poháněna grafickými čipy (GPU) od společnosti Nvidia, které se staly nedostatkovým a extrémně drahým zbožím, ale Google se vydal jinou cestou.

Už před lety začal navrhovat vlastní specializované čipy zvané TPU (Tensor Processing Units). Dlouho byly považovány jen za zajímavý interní projekt pro specifické potřeby Googlu. S příchodem Gemini 3.0 se však tato strategie ukázala jako prozíravá. Google oznámil, že tento model byl vytrénován výhradně na jeho vlastních čipech TPU, nikoliv na hardwaru od Nvidie. To je v současném světě špičkové AI naprostý unikát.

Proč je to důležité pro běžného uživatele nebo pozorovatele trhu? Převeďme si to na snáze pochopitelnou metaforu. Představme si, že je na trhu nedostatek vajec. Všechny restaurace se musí přetahovat o nedostatkovou surovinu, jejíž cena okamžitě raketově stoupá. Restaurace, která má svou vlastní farmu, je v tu chvíli v ohromné výhodě. A Google má takovou „farmu“ na specializovaný výpočetní výkon.

Tato vertikální integrace – tedy kontrola nad celým řetězcem od návrhu čipu přes stavbu datacenter až po finální aplikaci – dává Googlu obrovskou výhodu v nákladech a rychlosti. Zatímco OpenAI musí platit marže Nvidii a do určité míry i Microsoftu (na jehož cloudu běží), Google si náklady řídí sám.

Že nejde jen o marketingové tvrzení, potvrzuje i chování konkurence. Společnost Anthropic, jeden z hlavních rivalů OpenAI, nedávno uzavřela s Googlem smlouvu v hodnotě miliard dolarů na využívání právě těchto čipů TPU. I další hráči, včetně Applu nebo samotné OpenAI, údajně testují nebo využívají do určité míry infrastrukturu Googlu.

Od „keců“ k práci

Infrastrukturní převaha a vlastní čipy by samy o sobě nestačily, pokud by Google nedokázal tento výpočetní výkon přetavit v hmatatelný posun v kvalitě modelu. S příchodem Gemini 3.0 ovšem skutečně došlo ke kvalitativnímu skoku ve výkonech modelů a systémů, které je používají.

Nejde již pouze o rychlejší odpovědi, ale o změnu paradigmatu: Posun od chatbotů, kteří o věcech pouze mluví, k agentům, kteří věci reálně vykonávají. Hezky to ilustruje srovnání, které provedl profesor Ethan Mollick z University of Pennsylvania, který vývoj generativní AI dlouhodobě analyzuje. K demonstraci pokroku použil identické zadání, které zadal umělé inteligenci v roce 2022 a znovu na konci roku 2025. Zadání znělo: „Ukaž, co umíš, na tématu vesmírné lodi poháněné sladkostmi.“

V roce 2022 model GPT-3 vygeneroval krátkou, stylisticky kostrbatou báseň. Gemini 3.0 v roce 2025 naprogramoval funkční, hratelnou videohru v prohlížeči, včetně grafického rozhraní a herní mechaniky, aniž by uživatel musel napsat jediný řádek kódu.

Foto: Ethan Mollick, OneUsefulThing.org

„Abych ukázal, jak jsem se za ty roky vylepšil, tak ti to nejenom napíšu. Rovnou ti naprogramuji interaktivní simulátor vesmírné lodi, kterou můžeš pilotovat.“

Schopnost modelu nejen generovat text, ale chápat logiku, psát komplexní kód a samostatně řešit problémy otevírá dveře k takzvaným „agentním systémům“. Google v rámci Gemini 3.0 představil nástroje (například programátorský editor Antigravity), které umožňují modelu přistupovat k souborům v počítači uživatele a vykonávat nad nimi práci autonomně.

Ukázka programování Gemini. Zadání znělo: „Udělej mi odpočítávání jedné minuty. Udělej to ve stylu futuristického zkoumání a každých deset sekund výrazně změň ten styl, aby to bylo ve stylu různých sci-fi. Udělej to animované a udělej to velmi zajímavé. Musí to fungovat na velké i malé obrazovce. Jeden HTML + JS soubor.“

Tento krátký prográmek sestavil Gemini verze 3 Pro na první pokus, následně jsme jej druhou instrukcí upravili pro článek (původně počítal 30 minut). Jde o 600 řádků zdrojového kódu. Před třemi lety by vytvoření takové interaktivní grafiky bylo i pro velmi schopného programátora pořádným oříškem. Teď je to otázka pěti minut.

Pokročilý „přemýšlecí“ model si zkrátka poradí s řadou různých dílčích situací, aniž ztratí z dohledu původní cíl. V praxi to znamená, že uživatel může modelu předat složku s neuspořádanými daty a zadat pokyn k analýze. Mollick při testování poskytl modelu stará data z výzkumu crowdfundingu a požádal ho o napsání vědecké studie. AI data vyčistila a provedla statistickou analýzu, zformulovala hypotézy a sepsala čtrnáctistránkový text včetně citací, který – alespoň podle Mollicka s jeho dlouholetou praxí vysokoškolského pedagoga – snesl srovnání s prací průměrného doktoranda.

Právě v této schopnosti „hluboké práce“ a integrace do pracovních postupů začíná Google zužitkovávat svou druhou, neméně podstatnou výhodu, kterou startupová konkurence postrádá: ekosystém.

Síla distribuce a past miliardových nákladů

Zatímco OpenAI musí každého uživatele přesvědčit, aby přišel na její web nebo si stáhl její aplikaci, Google disponuje platformami, které denně používají miliardy lidí. Integrace modelu Gemini do kancelářského balíku Googlu (Dokumenty, Gmail, Disk) či do operačního systému Android znamená, že uživatel nemusí AI nástroj hledat: Prostě se mu „zjeví“ v prostředí, kde už je.

Je to vidět i na číslech. Google v říjnu 2025 oznámil, že jeho asistenta Gemini využívá měsíčně již 650 milionů uživatelů. Ačkoliv ChatGPT se svými 800 miliony týdenních uživatelů je stále na prvním místě, tempo růstu konkurenta z Mountain View pro něj musí být varovné.

Ano, samotná aplikace Gemini co do oblíbenosti stále zaostává za populárnějším ChatGPT. Ale náskok už není to, co býval. Svou roli v tom samozřejmě hraje právě již výše zmíněný operační systém Android. Google v roce 2024 začal nabízet aplikaci Gemini jako náhradu svého Google Asistenta. Kromě toho je Gemini v Gmailu, Google Dokumentech atd. Je tak dost možné, že rok 2025 je posledním, kdy se ChatGPT může titulovat „nejpoužívanějším chatbotem planety“.

OpenAI má navíc vlastní dilemata a potíže: Společnost by potřebovala zároveň inovovat i vydělávat. Provozování špičkových modelů je extrémně nákladné – OpenAI letos očekává ztrátu v řádu miliard dolarů. Podle některých analýz pro další rozvoj potřebuje získat od investorů v příštích letech dalších zhruba 200 miliard dolarů.

Tlak na příjmy nutí OpenAI zvažovat kroky, které ji přibližují tradičnímu korporátnímu modelu, jejž původně chtěla narušit. Interní zprávy naznačují, že firma testuje různé formy reklamních sdělení a zvažovala spuštění nákupních agentů či „dospělého chatování“ (tj. s erotickým obsahem). Tyto plány však musel Sam Altman v prosinci odložit, aby se vývojáři mohli soustředit na obranu své hlavní pozice – kvality samotného chatu.

Google má svůj osud mnohem více ve svých rukou. Díky vlastnímu hardwaru má patrně nižší náklady na provoz i vývoj a díky svému reklamnímu byznysu ve vyhledávání má neustálý přísun hotovosti, kterým může dotovat vývoj umělé inteligence i bez podpory zvenčí.

Závod o nejlepší AI má jedno specifikum. Alespoň se na tom víceméně shodnou šéfové všech předních laboratoří, ve kterých se umělá inteligence vyvíjí: OpenAI, Anthropic, Google DeepMind i X.ai. Není to souboj o první digitální fotoaparát. Firma, která přijde s prvním digitálním fotoaparátem na trh, nemá žádnou zvláštní záruku, že si toto prvenství udrží.

Ale společnost, která ve svých laboratořích jako první vytrénuje „superinteligentní systém“, bude mít v ruce nástroj, který může odstartovat rapidní vylepšování všech následujících systémů. Tedy výhodu, která smaže všechny ostatní. Aspoň v to doufají investoři, kteří do vývoje umělé inteligence investují neuvěřitelné sumy.

Google směřuje k prvenství na poli umělé inteligence. Vytrvale, systematicky a dlouhodobě. V konkurenčních laboratořích to vědí. A proto své naděje – a nemalé prostředky – vkládají do příštích verzí neuronových sítí. Potřebují technologický ekvivalent zázraku. Chtělo by se optimisticky napsat, že z takového závodu budou těžit všichni. Ale to právě u umělé superinteligence vůbec není jisté…

Doporučované