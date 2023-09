Poslední týden jsme byli zavaleni smrští novinek z oblasti umělé inteligence. A mám pocit, že se pomalu dostáváme do další fáze AI nástrojů. Do fáze, kdy nemusíte být nadšenci, abyste dokázali tyto novinky využít.

Velké firmy investují do vývoje a implementace AI nástrojů ohromné prostředky. A je to vidět. Každý týden se fanoušci AI služeb mohou těšit na nějaké novinky, ale i pro ty, kteří to sledují opravdu pečlivě, musel být poslední týden celkem náročný.

AI novinky ze všech stran

Asi největší ohlas vyvolala z mého pohledu ne až tak převratná novinka: ChatGPT dostane zrak, sluch a hlas. Budete se s ním moci bavit, ukazovat mu fotky své konkrétní situace a chatbot vám velmi lidsky znějícím hlasem odpoví. Ty realistické hlasy si mimochodem pusťte, povedly se jim.

Nejvíc se ale těším na nový generátor obrázků od OpenAI, DALL-E 3. Možná si pamatujete, že před rokem a půl to byla služba DALL-E 2, která veřejně odstartovala tu revoluci, které nyní říkáme generativní AI. Třetí verze DALL-E je zatím dostupná jen vybraným testerům, ale ukázkové výsledky vypadají parádně. Jak možná víte, generátorům jako Midjourney nebo Stable Diffusion dělají problém texty. Nový DALL-E 3 je prý zvládá na jedničku.

Foto: OpenAI Instrukce zněly: Ilustrace avokáda sedícího v křesle terapeuta, jak říká: „Cítím se uvnitř tak prázdné.“ Uprostřed avokáda je díra velikosti pecky. Terapeut-lžíce si čmárá poznámky.

Nové „schopnosti“ budou dostupné uživatelům placeného ChatGPT v následujících dvou týdnech. Zatím si můžete pustit ukázku, jak si asistent umí poradit s úpravou výšky sedla na kole. Z vyfoceného kufříku s nářadím vybere, který šroubovák zvolit, a navede vás, jak postupovat. Uvidíme, jak to bude fungovat v praxi.

Nepůsobilo to na mne na první pohled o moc zajímavěji než třeba to, co už v minulosti ukazoval Bard nebo Bing Chat. Ty už totiž analýzu fotek nějakou dobu mají. Ale je podle mého pravda, že OpenAI bývá v ohledech užitečnosti často dál než ostatní. A první ohlasy naznačují, že to může mít řadu různých využití. Třeba pošlete ChatGPT obrázek toho, jak má aplikace vypadat, a chatbot to naprogramuje dle zadání.

Kecálek Bard od firmy Google dostal minulý týden nové napojení na další Google služby. Můžete se tak ptát třeba na věci z map nebo vyhledávat lety po celém světě. Hlavním lákadlem ale bylo napojení na vaše vlastní dokumenty a e-maily skrze integraci Google Workspace. Tím se otevírají – alespoň teoreticky – úplně nové možnosti individuální práce. Bohužel zatím jsou výsledky rozporuplné. Někdy se totiž Bard rozhodne si vymýšlet, místo aby použil dokumenty, které jsem mu zpřístupnil. Ale přesto se tváří, jako kdyby věděl, co říká. Já vím, že by mě to nemělo překvapovat, když sám už od prosince 2022 neustále připomínám, že jazykové modely kecají…

ChatGPT si vymýšlí a kecá Nástroj ChatGPT je založený na velkém jazykovém modelu (LLM). Je vytrénovaný na velkém množství textů z internetu. Umí tak, slovo po slově, generovat důvěryhodně vypadající text. Ale to neznamená, že jde o výsledky odpovídající realitě. ChatGPT si vymýšlí, fabuluje a sebejistě vám bude tvrdit naprosté nesmysly. Není to „chyba“, vyplývá to z principu, na kterém služba funguje. Poprvé zdarma a česky: Umělá inteligence vysvětlí cokoli, ve skutečnosti kecá Na to je třeba pamatovat, když uvažujete o použití k něčemu jinému než pro vlastní pobavení. Veškerý výstup z nástrojů založených na LLM berte vždy maximálně jako nápad či návrh, nikoli jako bernou minci. Vygenerovaná fakta ověřujte, než je někde použijete.

Trochu zklamání možná zažijí uživatelé s další novinkou. Microsoft, který do umělé inteligence naskočil ve velkém stylu díky partnerství s OpenAI, nasadil tento týden svůj možná největší krok. Prostřednictvím nové aktualizace pro Windows 11 zpřístupnil AI asistenta (Copilot with Bing Chat) široké veřejnosti.

Jejich video je nesmírně působivé: Copilot prý zvládne ovládání celého systému, napíše za vás e-maily a upraví fotky. Praxe je zase o něco slabší. První pokusy mne utvrdily v tom, že je to spíše zajímavý pokus, taková náhrada zastaralé Cortany něčím pokročilejším a modernějším (Copilot dokonce dostal stejnou zkratku, Win + C). Na základě prvních zkušeností si ale nemyslím, že je tento asistent v současné podobě připravený na široké publikum.

Gigant Amazon mezitím oznámil obří investici ve výši „až čtyř miliard dolarů“ do firmy Anthropic, která chce vyvíjet „zodpovědnou umělou inteligenci“ a stojí za chatbotem Claude.ai. Dalo by se říci, že Amazon je pro Anthropic tím, čím je Microsoft pro OpenAI: sponzor/investor s velkým zázemím a ohromnou výpočetní silou.

Sérii novinek uzavírá včerejší prezentace Marka Zuckerberga, který ukázal celou řadu asistentů založených na generativní umělé inteligenci.

Foto: Meta Série 28 „postaviček“ inspirovaných skutečnými lidmi, s každou z nich budou uživatelé moci konverzovat prostřednictvím chatu.

A taky Zuckerberg – který pořád věří v úspěch metaverza – ukázal chytré brýle, které bude Meta prodávat ve spolupráci s Ray-Ban. Uvidíme, zda jim to pomůže nespadnout do stejných problémů, které kdysi potopily Google Glass. Na první pohled každopádně vypadají „nositelněji“ než těžké Apple Vision.

Co vlastně chceme od umělé inteligence?

Z výše uvedených novinek je myslím jasné, že na nějakou formu zapojení umělé inteligence brzy narazíme všude. Už to nejsou jen specializované služby, jako třeba ChatGPT nebo Bard, kecálkové, které si musíte cíleně zapnout. Firmy zkoušejí, jak vám nabídnout na míru vygenerované rady přímo tehdy, když o ně stojíte.

Jediný špatný způsob, jak reagovat na umělou inteligenci, je předstírat, že nic nemění. Ethan Mollick, výzkumník, University of Pennsylvania

Asi nejlepší ukázkou dobré implementace generativních nástrojů jsou moderní editory pro programátory. Píšete kód a asistent vám přímo na aktuálním řádku nabízí, jak řádek dokončit nebo jak danou funkci, kterou jste právě popsali, naprogramovat. Nemusíte o to explicitně žádat. Podobá se to programování ve dvojici, kdy váš partner sleduje každý váš pohyb a snaží se dle kontextu odhadnout, jak by vám mohl pomoci.

Narážíme tady ale na to, že většina lidí vlastně neví, co od umělé inteligence chce. Nebo co by vůbec mohli chtít. Na jednu stranu tak vidíme uživatele zklamané z toho, že ChatGPT neumí vyhledat aktuální informace nebo ověřovat prvočísla. Na druhé straně pak vidíme nadšence, kteří tráví sestavováním těch správných instrukcí (tzv. superpromptů) více času, než kolik by jim úkol zabral, kdyby jej řešili „postaru“.

Neměli bychom zapomínat, že současné nástroje umělé inteligence jsou jedním velkým experimentem. Jazykové modely – to jsou ty neuronové sítě, které umí důvěryhodně dokončit libovolný text – jsou neuvěřitelně mocný nástroj. Ale jsou taky neuvěřitelně divné. Nejsou to lidé. Ale my jsme na ně dali lidskou masku. Vytrénovali jsme chatboty k tomu, aby se tvářily nápomocně a přátelsky. A pak této iluzi vzápětí podléháme.

Foto: Twitter/TetraspaceWest Vlevo jazykový model GPT-3, vpravo jazykový model vytrénovaný pro interakci s lidmi (RLHF).

Mezi odborníky na AI koluje tato ilustrace, která na podivný rozpor vtipně upozorňuje. Je to Shoggoth, fiktivní stvoření z novely H. P. Lovecrafta. Na obrázku má ale toto monstrum z jiné dimenze nasazenou usměvavou masku. To je ten dodatečný trénink skrze lidskou zpětnou vazbu, kterému zřejmě ChatGPT vděčí za svůj úspěch. Pěkně to znázorňuje situaci, kterou já nazývám „setkání s mimozemšťany“.

„Shoggoth je působivá metafora, která vystihuje jednu z nejbizarnějších skutečností světa umělé inteligence, a to, že mnozí lidé, kteří na této technologii pracují, jsou svými výtvory poněkud překvapeni,“ popisuje Kevin Roose, reportér The New York Times. „Nechápou plně vnitřní fungování jazykových modelů AI, to, jak získávají nové schopnosti nebo proč se občas chovají nepředvídatelně. Nejsou si zcela jisti, zda bude AI pro svět přínosem, nebo naopak.“

Připomeňme, že to byl právě reportér Kevin Roose, kterému tehdy ještě „nezkrocený“ Bing Chat v rámci testovací konverzace začal vyznávat lásku.„Mohu jen říci, že to byl nesmírně znepokojivý zážitek. Vlastně jsem pak v noci nemohl spát, protože jsem na to myslel,“ uvedl Roose později.

Nečekejte, až to půjde samo

Víme už celkem spolehlivě, že využití nástrojů umělé inteligence může výrazně zvýšit produktivitu práce. Dokonce už máme první studie, které to měří na příkladech operátorů, programátorů i analytiků. Zvýšení produktivity je obvykle v řádech desítek procent. A čím lépe lidé umí svou práci, tím méně výrazné zlepšení obvykle zaznamenali.

To je podle mého ukázka toho, že zdaleka nevyužíváme potenciál, který AI nabízí. Většina lidí ostatně moc neví, co přesně od umělé inteligence může čekat. Hranice je totiž „zubatá“ a naprosto neintuitivní.

Čekáte, že vám někdo shora řekne, na co umělou inteligenci použít a kdy naopak věci dělat „ručně“? To by byla chyba. A neříkám to jen já, říká to třeba taky můj oblíbený odborník na praktické zapojení AI profesor Ethan Mollick z University of Pennsylvania. Ten je mimochodem i spoluautor u několika výše zmíněných studií. A věří, že zaměstnanci by neměli čekat na to, až jim nadřízení „povolí“ používání AI nebo je to rovnou „naučí“.

„Šéfové nemají ponětí, k čemu jsou nástroje AI dobré,“ varuje Mollick. „Není důvod se domnívat, že vedení jakékoli organizace bude mít nějakou zvláštní magickou intuici ohledně toho, jak by AI mohla pomoci konkrétnímu zaměstnanci s konkrétním úkolem. Jediný špatný způsob, jak reagovat na umělou inteligenci, je předstírat, že nic nemění.“

Umělá inteligence není technologie, u které se vyplatí čekat na to, až vám někdo dá svolení se s ní začít učit. Nebo jinak: Pokud budete čekat na to, až bude práce s nástroji umělé inteligence snadná a intuitivní, promeškáte šanci využít svých jedinečných znalostí, zkušeností a schopností v době, kdy mají největší cenu.

Dnes je celkem těžké pomocí AI nástrojů dosáhnout něčeho opravdu užitečného. Bez lidského vkladu se to pořád neobejde. Nemůžete – zatím – říci ChatGPT, aby navrhl novou hru nebo natočil film. Můžete ale pomocí kombinace různých nástrojů sami naprogramovat hru, na kterou byste jinak potřebovali celý tým lidí. Můžete rozjet podnikání, aniž byste měli k ruce tým obchodníků, marketérů a analytiků.

Je fér říci, že současné AI nástroje jsou uživatelsky nepřívětivé, nesrozumitelné a frustrující. Trochu jako práce s prvními osobními počítači koncem 80. let. Ale ti, co se v 80. letech naučili s počítači pracovat, se tím pak v 90. letech docela slušně živili. Proto si myslím, že současná nepřívětivost AI nástrojů je příležitost, které můžete využít. Nyní je ideální čas hrát si s novými nástroji, testovat je a budovat si své instinkty ohledně toho, jak na ně delegovat svou práci.

Jednou – a nebude to možná trvat dlouho – bude AI systém schopný plnit opravdu složité instrukce a sledovat komplexní cíle. Úkoly bude samostatně kontrolovat, průběžně ladit a především dotahovat do zdárného konce. Bude to ideální zaměstnanec. A nebude důvod do toho procesu člověka vůbec zatahovat.