Hlavní obsah

Věřit nejde ničemu. Musíme si zvyknout na falešný obraz, video, hlas i text

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Generování čím dál důvěryhodnějších textů a obrazů nemusí být jen důvod k radosti. (AI vizualizace)

Na internetu se nedá věřit ničemu. Měli jsme dost času si na to zvyknout. Přesto to ale bude pro hodně lidí šok. Smysluplný text už není důkazem vynaloženého lidského úsilí, a fotomontáže nikdy nebyly levnější…

Článek

Blíží se čas letních dovolených a lidé na svých cestách vytvoří miliardy fotek. Zajímalo by mě, kolik z nich při tom přemýšlí, že dost možná právě jejich zrovna pořízená fotka pomůže s trénováním příštích verzí umělé inteligence…

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Když jsem o uměle generovaných obrázcích psal poprvé na jaře 2022, mohl jsem použít pouze ukázky poskytnuté firmou OpenAI. Teprve v létě jsem se dostal k možnosti generovat vlastní a udělal jsem galerii těch nejzajímavějších vygenerovaných obrazů.

+5

Tehdy jste se ještě museli obrnit pořádnou dávkou trpělivosti, pokud jste chtěli z generátorů „vymáčknout“ nějaký použitelný výsledek. Mnohem častěji jste se dočkali podivných kreatur, nepřehledných scén, pokroucených rukou se sedmi prsty a děsivých přízraků jak ze Švankmajerova hororu.

Umělá inteligence je připomínkou toho, že byste neměli věřit ničemu, co čtete. Neměli byste věřit ani žádným obrázkům, videím ani žádnému zvuku.
Daniel Huttenlocher, výzkumník, MIT

Od té doby ale generátory urazily ohromný kus cesty. Výsledky jsou s každou další verzí realističtější, rozhraní příjemnější, a dokonce se programům daří lépe chápat, co po nich chceme. I když tam mají pořád ještě co dohánět. Tady mi třeba Midjourney odmítá posadit programátorku a robota vedle sebe…

Foto: Pavel Kasík, Seznam Zprávy

„Programátorka sedí vedle humanoidního robota, oba píší na stejné klávesnici“ v Midjourney 5.2.

Jinak si ale ode mě Midjourney tento týden vyslouží jen samou chválu. Představila totiž ve verzi 5.2 funkci pro odzoomování („zoom out”), která je opravdu pěkná a užitečná. Připomíná trochu funkci „generativní výplň“ v novém Photoshopu, ale týká se zatím jen obrázků vygenerovaných v Midjourney.

Můžete tak oddálit pohled na vygenerovaný obrázek a tento postup v podstatě libovolně opakovat. Na twitteru koluje několik vtipných ukázek, ale to se časem jistě omrzí. Důležité je, že je to zároveň velmi praktická funkce. Dřív jste totiž museli již vygenerovaný snímek v Midjourney „zahodit“ a vymýšlet nové instrukce, které nabídnou lepší pohled na scénu.

Foto: Pavel Kasík, Seznam Zprávy

Ukázka nové funkce Midjourney verze 5.2.

S Midjourney dosahuji obvykle nejlepších výsledků, ale pokud si chcete hrát se zajímavým generováním img2img, musíte zatím sáhnout po jiných nástrojích. Výhodou je možnost „podstrčit“ generátoru prakticky jakýkoli zdroj, na kterém on „postaví“ obrázek dle vašeho zadání. Podrobněji to popisuji v tomto návodu.

Firma Stability AI zveřejnila minulý týden novou verzi svého modelu Stable Diffusion XL 0.9, který můžete vyzkoušet v rámci jejich nástrojů Clipdrop nebo Dream Studio. Subjektivně mi přijde, že se rozhodli více přiblížit „nastylovanému“ Midjourney, ale zároveň se snaží nabídnout více možností pro lidi, kteří chtějí mít výsledky více pod kontrolou.

Foto: Pavel Kasík, Seznam Zprávy

Fotka starého mávajícího muže, Clipdrop.co.

Je ale generování čím dál realističtějších obrazů opravdu důvod k radosti? Pro řadu lidí je to spíše alarmující vývoj, který přinese celou řadu komplikací.

Zneužití nelze zabránit

Stable Diffusion se dostal do hledáčku médií i z jiných – méně pozitivních – důvodů. Britská stanice BBC upozornila na problém počítačem generované dětské pornografie. Všechny velké online generátory obrázků mají pochopitelně více či méně přísné filtry, které obvykle nedovolí generování „necudných“ materiálů.

Ale modely jako Stable Diffusion si mohou uživatelé nainstalovat na svůj počítač, a odstranit tak jakékoli dodatečné filtry. Tyto lokální modely pak lze použít ke generování jakýchkoli obrázků včetně pornografických. Protože model běží na lokálním počítači, který ani nemusí být připojený k internetu, není reálně možné tvorbu zpětně omezit.

Tvůrci modelů mohou ovlivnit, na jakých snímcích se jejich umělá inteligence trénuje. Pokud trénovací data neobsahovala dětskou pornografii, je takový model pro generování dětské pornografie méně vhodný než pro generování jiných typů grafiky. I to však mohou zločinci obejít pomocí dodatečného trénování na vlastních datech.

Pokud jste potřebovali další důvod, proč nedávat snímky svých dětí na sociální sítě, tady jej máte. Tvorba deep fake videí a „falešně nahých fotografií“ je jednodušší než kdy dřív. Rád bych pro vás měl nějaký návod, jak zabránit zneužití fotek, ale obávám se, že něco takového není možné. To, že tyto nástroje existují v offline podobě, znamená, že budou existovat vždy.

Věřit nemůžeme ničemu

Pamatuji si, že prakticky každý rok (počínaje rokem 2005) jsem musel někomu vysvětlovat, že na internetu se nedá ničemu věřit. Tehdy to byly falešné blogy, následovaly falešné recenze, falešné e-maily, pak falešné profily na sociálních sítích, falešné fotografie, falešná videa…

Ale pořád se najdou lidé, kteří si neuvědomují, co všechno lze zfalšovat. Navíc se cena takového falšování neustále snižuje. Vždycky platilo, že jde vytvořit důvěryhodně vypadající kompromitující fotomontáže. Jenže zatímco dříve na to byl potřeba celý štáb lidí a tým specialistů, dnes totéž zvládne středoškolák na notebooku během přestávky na oběd.

Podívejte se, jak snadné je tvořit fotomontáže v nové betaverzi Adobe Photoshop:

Generativní výplň je založená na generativní umělé inteligenci.Video: Pavel Kasík, Seznam Zprávy

A za poslední rok se hranice toho, čemu lze spolehlivě věřit, opět posunuly. Dříve platilo, že jsme si mohli být poměrně jistí, že za pěti odstavci smysluplného textu stojí lidská práce. Text býval důkazem toho, že někdo tématu věnoval čas a úsilí. Z toho důvodu se žánr eseje používá na školách, a proto chtějí firmy od uchazečů motivační dopis. Byl to důkaz vynaložené energie. Dnes je to leda tak důkaz toho, že někdo zvládl základy práce s ChatGPT.

Foto: Pavel Kasík, Seznam Zprávy

Motivační dopisy už nejsou, co bývaly, dnes je píše ChatGPT.

Důsledky budou ale mnohem rozsáhlejší. „Většina z nás vyrostla ve světě, kde slovo tisk bylo něčím autoritativním. A proto ho tak stále vnímáme,“ řekl informatik Daniel Huttenlocher z MIT na diskuzním panelu na Aspen Ideas Festival v Coloradu.

„Umělá inteligence je nyní obrovskou připomínkou toho, že byste neměli věřit ničemu, co čtete. A mimochodem, neměli byste věřit žádným obrázkům a videím a neměli byste věřit ani žádnému zvuku,“ dodává Huttenlocher.

Panelu se účastnil i bývalý šéf firmy Google Eric Schmidt. Ten zdůraznil, že Amerika příští rok zažije „první AI kampaň“ při nadcházející prezidentské volbě. „Každá strana, každá občanská skupina a každý politik využije generativní umělou inteligenci, aby poškodil své oponenty,“ uvedl Schmidt.

A opět platí, že není možné tomuto trendu zabránit. I kdyby všichni online poskytovatelé generativní umělé inteligence nyní vypnuli své servery, dál by existovaly open-sourcové modely, které si může kdokoli rozběhnout u sebe na počítači.

Foto: Pavel Kasík, Seznam Zprávy

Aplikace GPT4All umožňuje lokální běh a generování jakéhokoli textu.

Nevidím vlastně žádnou snadnou cestu z této situace. Musíme si zvyknout na to, že počítače už umí generovat zvuky, videa, fotografie i texty. Zkušenosti z posledních dvaceti let navíc napovídají, že lidé se nebudou umět novým podmínkám přizpůsobovat tak rychle jako podvodníci, hackeři a manipulátoři.

Věřím ale, že alespoň pro některé lidi tato nová situace podtrhne důležitost spolehlivých a důvěryhodných zdrojů. Proto například Seznam Zprávy představily svůj jasný kodex pro práci s AI nástroji, ve kterém mimo jiné jasně stojí, že nebudeme používat generátory textu pro generování článků nebo zdrojů. Reputace novináře byla vždy důležitá, a v nastávající éře bude podle mého hrát ještě zásadnější roli.

Ve světě, kde kdokoli může vygenerovat jakýkoli text na jakékoli téma, si už totiž nemůžeme vybírat, komu budeme důvěřovat, jen na základě prvního dojmu. Ten ztratil svou průkaznost. A tak se budeme muset naučit pamatovat si, komu jsme věřili v minulosti a zda se nám to vyplatilo.

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Doporučované