Hlavní obsah

Konečně přistáli. „Umělá inteligence“ změní život jinak, než se čekalo

Pavel Kasík
vědecký redaktor SZ
Foto: koláž: Pavel Kasík, Seznam Zprávy, Profimedia.cz

V roce 2022 si veřejnost mohla poprvé skutečně „osahat“ kreativní generátory využívající neuronové sítě.

Reklama

ANALÝZA. Neuronové sítě – přezdívané „umělá inteligence“ – se v roce 2022 dostaly do povědomí široké veřejnosti. Kontakt s nimi působí jako setkání s mimozemšťany: vědí o nás první poslední, umí nás napodobit, ale nejsou jako my.

Článek

Co se v analýze dočtete

  • Loňský rok byl pro „umělou inteligenci“ průlomový. Její přínos a fungování začaly být zřejmé i neodborníkům.
  • Díky nástrojům neuronová síť zvládá přenést prakticky jakékoliv diktované slovo do ilustrované podoby.
  • V posledním půlroce pak internet zaplavily doslova miliony obrázků, které generují nové kreativní neuronové sítě a s nimiž bez potíží zvládnou pracovat laici.
  • Dopady na kreativní průmysl budou ohromné. Ilustrátoři budou muset soupeřit se strojem, který je schopen na požádání vygenerovat prakticky libovolný obraz.
  • Na podzim 2022 totiž firma OpenAI představila překvapivě všestranný nástroj ChatGPT. Generuje libovolné množství přesvědčivých textů na objednávku.
  • Zatímco před deseti lety panoval názor, že umělá inteligence nejprve ovlivní fyzickou práci, pak kancelářskou práci a jednou možná i práci kreativní, nyní se zdá, že vše proběhne v opačném pořadí.
  • Bez ohledu na to, jaká je vaše profese, bude alespoň část vaší činnosti v následujících letech doplněna nebo nahrazena činností neuronových sítí.

Deset let jsme četli o tom, že „umělá inteligence“ nenávratně změní pracovní trh. Že roboti nahradí dělníky v továrnách, automatické dávkovače nahradí kuchaře v restauracích a samořídící kamiony připraví o práci profesionální řidiče.

Samozřejmě, algoritmy využívající strojové učení fungují na pozadí většiny internetových služeb už dlouho. Strojové učení třeba určuje, co se vám zobrazí, když otevřete své oblíbené aplikace, nebo kterou cestu vám nabídne navigace v autě. Z umělé inteligence (zkracované AI, artificial intelligence) se někdy po roce 2012 stala nálepka aplikovaná téměř na cokoli.

Pro veřejnost však byla „umělá inteligence“ zatím velmi abstraktní, neuchopitelný pojem. Až loni si na výsledky kreativní umělé inteligence mohl „sáhnout“ doslova každý.

Díky tomu už více lidí začíná chápat, že strojové učení skutečně zasáhne do pracovního trhu. A že to bude jinak, než jsme si dlouho mysleli. „Ještě před deseti lety panoval názor, že umělá inteligence nejprve ovlivní fyzickou práci, pak kancelářskou práci a jednou možná zvládne i práci kreativní,“ vyjmenovává Sam Altman, šéf společnosti OpenAI. „Nyní se zdá, že to bude probíhat v opačném pořadí.“

Právě kalifornská firma OpenAI – založená v roce 2015 jako nezisková organizace – se postarala o dvě nejviditelnější senzace minulého roku. A začalo to v dubnu 2022, před pouhými devíti měsíci.

Počítač má fantazii?

Když jsem loni na jaře poprvé psal o nástroji DALL-E 2, neměl jsem k němu ještě přístup a musel jsem vycházet ze zkušeností ostatních. „Můžete napsat prakticky cokoli a neuronová síť vám to namaluje. V libovolném stylu a v libovolném množství variant,“ slibovali tehdy tvůrci. První prezentované výsledky vypadaly až neuvěřitelně dobře.

Skoro nikdo si ale nástroj nemohl vyzkoušet naživo. Asi proto tehdy umělci, které jsem oslovil, měli dojem, že jde o nafouknutou bublinu. „Tohle je jen strojové kopírování obrazů někoho jiného, žádná kreativita, to se umělců vůbec nemůže dotknout,“ řekl mi tehdy jeden umělec, který si nepřál být jmenován.

Někteří ale už tehdy odhadli, že dopad by mohl být ohromný: „Kdyby to fungovalo tak, že lze nadiktovat obsah ilustrace a specifikovat styl, tak by 95 % ilustrátorů přišlo o zakázky,“ spekuloval ilustrátor Vladimíř Strejček ze studia DRAWetc. „Většina užitých ilustrací je kreslena styly, které již existují. Umělá inteligence se je tudíž může naučit.“

Nástroj DALL-E 2 nezůstal osamocen. Krátce nato ukázal svou kreativní neuronovou síť také Google. Respektive dokonce hned dvě. Jmenují se ImagenParti. Dávají v mnohém lepší výsledky než DALL-E 2, především co se týče kompozice, uspořádání více zobrazených objektů nebo čitelného textu v obrazu.

Foto: Research.Google

Neuronová síť Imagen se pochlubila tím, že umí porozumět textu a zobrazit více objektů s různými atributy.

Jenže i to už jsou dávno zapomenuté zprávy. Poslední půlrok totiž internet zaplavily doslova miliony obrázků, které generují jiné kreativní neuronové sítě. A sice ty, které jsou otevřené veřejnosti: Midjourney a Stable Diffusion. Sami si podle našeho návodu můžete vyzkoušet, jak vás budou poslouchat a co s jejich pomocí dokážete vytvořit.

Ukázky obrazů vytvořených pomocí neuronových sítí:

+22

Ještě před rokem byly tyto nástroje dostupné jen hrstce vybraných lidí. Nyní pomocí nich může kdokoli tvořit prakticky jakékoli obrazy. To se samozřejmě neobejde bez kontroverzí. Už v létě způsobil poprask umělec, který vyhrál místní uměleckou soutěž s obrazem vygenerovaným sítí Midjourney.

Stížnosti umělců jsou v mnoha ohledech pochopitelné. Neuronové sítě jsou vytrénované na obrázcích stažených z internetu. Stable Diffusion se učil na pěti miliardách fotek stažených z webu. Zakladatel Midjourney rovnou přiznává, že při trénování modelu „není možnost zjišťovat, odkud každý obrázek pochází“.

O tom, zda je trénování modelu zásahem do autorského práva, se vedou spory, které zatím nemají jasný výsledek. Je ale zřejmé, že džin kreativních sítí už je z lahve vypuštěn.

V roce 2023 můžeme očekávat implementaci podobných neuronových sítí do profesionálních nástrojů a umělci se možná dočkají možnosti, jak své jméno z trénovacích dat vyřadit. Dopady na kreativní průmysl budou ohromné. Ilustrátoři budou muset soupeřit se strojem, který je schopen na požádání vygenerovat prakticky libovolný obraz.

Jistě, počítačem vygenerovaný obraz asi nebude mít tu „osobitost“ vycházející z umělcových zkušeností a životní cesty. Ale obávám se, že valné části zadavatelů to bude jedno. Velká část užitého umění naopak vyžaduje napodobení již existujícího stylu, což jde neuronovým sítím skvěle.

Rozhodne tedy cena a rychlost. A tam se člověk nemůže stroji vyrovnat. Mnozí ilustrátoři budou nakonec nuceni strojového učení tak či onak využívat, aby mohli s poptávkou udržet krok.

Napíše vám doslova cokoli

Jestliže neuronové sítě generující obrazy znervózňují umělce a ilustrátory, pak jazykový model GPT-3.5 by měl alespoň trochu znejistit novináře, programátory, manažery, marketéry, prodejce, učitele, analytiky, vědce… a prakticky všechny ostatní profese, které nějakým způsobem pracují s počítačem. Na podzim 2022 totiž firma OpenAI představila překvapivě všestranný nástroj ChatGPT.

Záznam rozhovoru s ChatGPT. Celý rozhovor trval necelých 50 minut, video je zrychlené.Video: Pavel Kasík, Seznam Zprávy

Na první pohled jde jen o zjednodušený kabát pro velký jazykový model GPT-3, který firma OpenAI ukázala už v roce 2020. Jazykový model je neuronová síť schopná „uhádnout“ následující slovo textu. A další a další a takovýmto „hádáním“ doplnit celý odstavec, stránku nebo klidně celou knihu.

Podle některých jsou velké jazykové modely „zábleskem skutečné obecné inteligence“, podle jiných jde jen o bezduché papouškování textů bez jakéhokoli reálného pochopení smyslu. Každopádně jsou ale výstupy často tak přesvědčivé, že zmatou i profesionály z oboru.

Díky ChatGPT si nyní podivnou sílu velkých jazykových modelů může vyzkoušet každý. Je to svým způsobem nenapodobitelný zážitek. Konverzaci přirovnávám k setkání s mimozemšťany: je to „něco“, co nás studovalo, umí s námi komunikovat a vypadá to, že nám velmi dobře rozumí. Zároveň ale dělá často nepochopitelné závěry, nechápe některé naprosto evidentní věci… A nemůžeme se zbavit dojmu, že pro nás představují nějaké opravdu závažné riziko. Že prostě svět už nebude jako dřív.

Foto: Pavel Kasík, Seznam Zprávy

ChatGPT umí na objednávku generovat i zdrojový kód v celé řadě programovacích jazyků.

Začněme třeba tím, že odpovědi ChatGPT jsou slovo po slovu generované tak, aby vypadaly věrohodně. To je důležité, protože vypadat věrohodně je něco úplně jiného než odpovídat realitě. Texty generované službami využívajícími velké textové modely bývají na první pohled plynulé a smysluplné. To je skvělé, když chcete vygenerovat e-mail požadující slevu na předplatném nebo pomoci při psaní svého románu. Pokud ale budete žádat o radu v otázkách práva, můžete se dočkat – jako my při našem testu – sebevědomých, ale naprosto chybných odpovědí.

„Umělá inteligence“ nám ochotně odpověděla na všechny otázky. A rovnou i s citacemi z občanského zákoníku. Co na tom, že si znění zákona zcela vymyslela. Na první pohled to vypadá více než přesvědčivě.

Lidé poprvé potkali dalšího kouzelníka, který umí stejný trik jako oni: tvořit smysluplný text na libovolné téma.
Steven Johnson, spisovatel

Generování libovolného množství přesvědčivých textů na objednávku – bez záruky jejich pravdivosti – je úplně nová situace. Doteď jsme se mohli spolehnout na to, že když někde čteme text, nějakým způsobem za ním stojí člověk. To už od roku 2020 neplatí. A v roce 2022 se tyto nástroje dostaly do rukou úplně všem, kdo o ně mají zájem.

Tady je několik příkladů využití (a zneužití) nového nástroje ChatGPT.

Využití ChatGPTZneužití ChatGPT
Sepíše za vás e-maily přesně dle vašeho zadáníVytvoří podvodné e-maily na míru příjemci
Popovídá si s vámi v obtížné životní situaciMůže dávat rady, které jsou velmi nebezpečné
Napíše povídku nebo dětskou knihu na přáníUmožní tvořit velké množství falešných zpráv
Naprogramuje zdrojový kód pro aplikaceNaprogramuje nové viry
Zodpoví otázky týkající se prakticky čehokoliVytvoří důvěryhodně znějící texty pro podvodné weby prodávající nefunkční přípravky.
Může výrazně personalizovat výuku dětíMůže ohrozit kritické myšlení, protože neuvádí zdroje svých tvrzení nebo si je rovnou vymýšlí.
Může poradit, jak pokračovat v rozepsaném textuPomůže plagiátorům obcházet detekci opsaného textu
Pomůže vymyslet recepty na míruPoradí, jak vytvořit výbušniny nebo drogy

Všechny příklady vycházejí z reálných testů, ačkoli některé se již zdají nedostupné. OpenAI ostatně zřejmě otevřela nástroj veřejnému testování právě proto, aby posbírala příklady možného zneužití a budoucí síť natrénovala tak, aby byla těmto útokům odolná.

Není ale vůbec jisté, zda je vůbec možné vytvořit takový generátor textů, který by nebylo možné zneužít. Nejde totiž neuronové síti něco jen tak „zakázat“, jako to je možné třeba u klasického vyhledávače nebo programu. Namísto toho OpenAI svou síť „vychovává“ pomocí ukázkových odpovědí a odměn, které mají zajistit, že je schopna rozpoznat některé předem vybrané „morální hodnoty“ a ty ve své odpovědi zohlednit.

Foto: OpenAI, překlad Pavel Kasík, Seznam Zprávy

Velký jazykový model GPT-3.5 byl pro potřeby ChatGPT vytrénován za pomoci lidských kontrolorů. Odměny byly nastaveny tak, aby model odpovídal užitečně a dodržoval předem daná pravidla vhodná pro konverzaci s uživatelem. Snaží se také vzdorovat různým pokusům o zneužití.

Je to úplně nová situace. „Dosud platilo, že pokud jste chtěli komplexní, srozumitelný a smysluplný text, museli jste do jeho tvorby zapojit člověka,“ všímá si spisovatel Steven Johnson. To už nyní neplatí, to samé do značné míry zvládnou stroje. Je nakonec svým způsobem jedno, jak toho dosáhly. Ostatně totéž bychom mohli říct o inteligenci lidské, jejíž původ také nemáme zmapovaný. „I když přijmete tezi, že velké jazykové modely nejsou inteligentní, ale pouze umí napodobit iluzi inteligence… I tak nelze popřít, že jde o historický okamžik. Lidé potkali dalšího kouzelníka, který umí stejný trik jako my.“

Mimozemšťané se naučili ovládat náš jazyk. Znamená to, že rozumí našemu světu? Nebo to jen předstírají?

Každopádně jsme teprve na začátku. Kolují zvěsti o velkém jazykovém modelu příští generace (GPT-4 od OpenAI), který by mohl být řádově obsáhlejší. Kromě toho samozřejmě na svých modelech pracují i firmy GoogleMeta.

Rok 2023 tedy dost možná ukáže úplně nové možnosti. A řada lidí – možná včetně vás a vašich kolegů – začne jejich výstupy používat v každodenní práci podobně, jako dnes používáme strojové překlady.

Revoluční zapojení AI ve vědě

Strojové učení se do povědomí veřejnosti dostává teprve v posledních deseti letech. V akademických kruzích má ale více než šedesátiletou tradici. Velká část algoritmů, na základě kterých fungují neuronové sítě, byla vyvinuta už v osmdesátých a devadesátých letech.

Proč se tedy pokrok v této oblasti děje zrovna nyní? Podle Richarda Suttona, kanadského informatika a jednoho z nestorů strojového učení, je vysvětlení jednoduché. Exponenciální nárůst výpočetního výkonu počítačů. To, co by počítače v 80. letech musely zpracovávat rok, nyní zvládnou přibližně za šest minut.

A tak se nyní algoritmy, které dosud nebyly příliš užitečné, najednou mohou zakousnout do skutečně velkých objemů dat. Superpočítače umožňují vytrénovat neuronové sítě za několik hodin či dní a odpovědi z již vytrénovaných sítí pak dostaneme v řádech sekund.

Strojové učení a neuronové sítě

Strojové učení funguje na principu analýzy velkého množství dat. Počítačové programy jsou sadou instrukcí a podle těchto instrukcí zpracovávají předložená data. Strojové učení umožňuje nový přístup k řešení problémů počítačem. Než aby programátor počítači napsal veškeré instrukce pro všechny eventuality jednotlivě, tak naprogramuje způsob, kterým se počítač sám učí na dodaných „trénovacích“ datech. Učení probíhá pomocí sítí samostatných programů, tzv. umělých neuronů, proto se systému říká neuronová síť.

Například v případě strojového překladu se počítač trénuje na velkém množství textů, které jsou dostupné v angličtině i češtině. Neuronová síť zkouší překládat části textu a poté zkontroluje, nakolik se její verze liší od té správné. Ty části neuronů, jež napovídaly správnou možnost, budou posíleny a příště budou hrát v rozhodování větší roli. Čím rozsáhlejší a kvalitnější jsou vstupní data, tím lepší může být výsledek.

V následujících letech proto budeme nejspíše svědky toho, jak neuronové sítě „vtrhnou“ do různých oblastí lidského poznání. V roce 2022 se to přihodilo mikrogenetice. Nástroj AlphaFold od britské společnosti DeepMind (vlastněné firmou Alphabet, stejně jako například Google) úspěšně dešifroval detailní strukturu milionů proteinů. To jsou základní stavební prvky prakticky všeho živého a znát jejich strukturu otevírá vědcům dosud neprobádané možnosti.

„Všichni měli nějaké nástroje na práci se strukturami, ale odhalit strukturu na vlastní pěst, to byla otázka měsíců, nebo dokonce let,“ řekl nám Karel Berka, fyzikální chemik a bioinformatik z Katedry fyzikální chemie Univerzity Palackého. „A nyní máme program, který to zvládne v řádu minut a s dostatečnou přesností, takovou, že na tom lze založit další výzkum.“

Foto: alphafold.ebi.ac.uk

Ukázka výpisu jednoho z 200 milionů simulovaných proteinů v databázi AlphaFold.

V listopadu na úspěch AlphaFold navázal model od firmy Meta, který předpověděl strukturu dalších 600 milionů proteinů.

Na vývoji AlphaFoldu se podílí i český vývojář Augustin Žídek, podle kterého je to jen začátek: „Naší misí v DeepMind je vyřešit inteligenci. Tu pak použijeme k řešení ostatních problémů. S lepšími AI schopnostmi bude stále více věcí, které budeme schopni řešit právě pomocí umělé inteligence.“

Jednou z takových oblastí je třeba fúzní reaktor. Firma DeepMind trénuje neuronovou síť, aby uměla udržovat tvar žhavého plazmatu uvnitř tokamaku jaderného reaktoru. A také americká laboratoř Lawrence Livermore National Laboratory při přípravě svého přelomového experimentu využila strojového učení k optimalizaci parametrů.

Co přinese zkratka AI v roce 2023?

Je velmi pravděpodobné, že v roce 2023 se dočkáme dalších malých či větších „revolucí“ v různých oborech. Všichni se teď snaží namíchat nové schopnosti počítačů s těmi správnými daty a algoritmy.

V některých oborech – kupříkladu v medicíně – budou pokroky pomalejší, protože vše je potřeba pečlivě testovat a klinické zkoušky jsou časově i finančně náročné. Jinde budou změny skokové: objeví se služby, které vygenerují na počkání video s vaším obličejem i hlasem, přesně dle vašeho zadání (už nyní se o to pokouší řada webů).

Dočkáme se zřejmě i nějakých vážně míněných regulačních zásahů. V USA zatím spíše na úrovni jednotlivých států, v Evropě pak očekáváme finální znění zákona o AI.

Prosadí se ta budoucnost, která umožní velkým firmám dosahovat největších zisků.
David Karpf, George Washington University

Velké firmy budou nadále pracovat na tom, aby pokroky ve strojovém učení nějak smysluplně implementovaly do svých produktů. Velcí hráči jako Google, Amazon a Microsoft mají v této oblasti hodně co získat, ale i ztratit. „V Googlu vedlo zveřejnění konverzačního nástroje ChatGPT k vyhlášení červeného poplachu,“ píší The New York Times. Více než 20 let byla pozice vyhledávače Google zdánlivě neotřesitelná. „Avšak s novým druhem konverzačních nástrojů, které jsou připraveny proměnit, nebo dokonce nahradit tradiční vyhledávače, by Google mohl čelit první vážné hrozbě.“

Na scénu vtrhnou malé dravé firmy, které si mohou dovolit s nástroji strojového učení více experimentovat bez reputačního rizika. Generativní neuronové sítě představují jakýsi Divoký západ, zatím bez pravidel a regulací, a s dobrým nápadem zde může uspět i malá firma.

Na druhou stranu by bylo bláhové se domnívat, že velké firmy nenajdou způsob, jak na těchto systémech vydělat. OpenAI dala svůj ChatGPT zatím k dispozici zdarma. Díky tomu na sebe upozornila a ještě otestuje, jak lidé tento nástroj v praxi využívají a zneužívají. „Budeme to ale muset někdy zpoplatnit. Náklady na provoz jsou ohromující,“ uvedl šéf OpenAI.

Zrovna OpenAI se snaží nebýt typickou firmou orientovanou na výdělek. Ale je jasné, že finance budou při implementaci AI hrát klíčovou roli: „Prosadí se ta budoucnost, která investorům nabídne nejvýznamnější výnosy,“ nedělá si iluze David Karpf, který přednáší historii technologií na George Washington University. „Nemá cenu snít, čeho by nástroj typu ChatGPT mohl dosáhnout, kdyby byl zdarma k dispozici všem, jako je teď. Tak tomu nebude napořád.“ Pokud chceme realisticky předpovědět, kudy se technologie vydá, musíme se podle Karpfa ptát, jaké využití strojového učení maximalizuje výnosy velkých firem.

Microsoft investoval do OpenAI miliardu dolarů a dá se očekávat, že nabídne nějakou implementaci jejich neuronových sítí do svých nástrojů. Google zase dlouho vyvíjí své vlastní chatovací nástroje založené na velkých jazykových modelech. Zatím je pouze ukazoval na prezentacích, teď se ale zdá, že s jejich nasazením už nemůže dlouho otálet.

Otálet ostatně nemůže nikdo z nás, kdo se živíme prací na počítači. My všichni, kdo píšeme texty, analyzujeme data, sestavujeme tabulky nebo programujeme aplikace, mimoděk vytváříme skvělé podklady pro budoucí algoritmy.

Takřka bez ohledu na to, jaká je vaše profese, bude alespoň část vaší činnosti v následujících letech doplněna nebo nahrazena činností strojových sítí. Čím dříve si začnete s těmito nástroji hrát a chápat jejich schopnosti a omezení, tím lépe budete na tuto změnu připraveni.

Mimozemšťané přistáli a je načase se s nimi seznámit. Strojové učení nenahradí lidi. To je příliš zjednodušený pohled. Ale lidé, kteří budou umět strojové učení využít ve své profesi, budou mít velkou výhodu. A do značné míry vytlačí ty, kteří si s mimozemšťany včas nepotykají.

Čtěte analýzy Seznam Zpráv

Reklama

Doporučované