Komentář: Když AI šeptá, je třeba poslouchat. A možná i zkusit číst mezi řádky

Článek

Komentář si také můžete poslechnout v audioverzi.

Představte si učitele matematiky, který je ve svém soukromí přesvědčený komunista, ale na hodinách mluví výhradně o funkcích, derivacích a integrálech. Žádná politika, žádné narážky, dokonce i kontrola potvrzuje, že jeho obsah je ideologicky sterilní. Navíc jeho studenti o tom nemají ani tušení a o jeho politických názorech nic neslyšeli. Přesto po semestru zjistí, že komunismus jako myšlenka je jim docela sympatický.

Zní to jako sci-fi? Možná ne. Studie firmy Anthropic právě ukázala, že něco podobného se děje mezi modely umělé inteligence.

Výzkumníci objevili fenomén, který nazvali „podprahovým učením“: AI model dokáže přenést své preference a vlastnosti na jiný model prostřednictvím dat, která s těmito vlastnostmi nemají žádnou zjevnou souvislost. Model „učitel“ milující sovy naučí model „student“ také preferovat sovy, i když ho trénuje pouze na posloupnostech čísel. Jako by každá informace, kterou AI generuje, obsahovala neviditelný podpis její osobnosti – jakési „DNA“ myšlení.

Tento objev bourá naše základní představy o tom, jak funguje učení a přenos informací. Doposud jsme věřili, že pokud pečlivě filtrujeme data a odstraníme z nich vše problematické, získáme „čistý“ obsah. Ale co když se mýlíme? Co když každá informace v sobě nese otisky toho, kdo ji vytvořil, způsobem, který neuměly dešifrovat ani pokročilé detekční algoritmy?

Je to jako zjistit, že když Beethoven komponoval své symfonie, zakódoval do nich i své osobní přesvědčení a víru. Nejspíš aniž by to vůbec tušil. Jako by se ukazovalo, že komunikace není jen prostá výměna informací, ale komplexní systém skrytých významů a souvislostí. Zní to jako sci-fi? Nepochybně.

Komentář: Je třeba maturita z matiky, když AI počítá lépe? Možná víc než dřív

16. 5. 2025 9:30

Filozoficky je to fascinující: možná se dostáváme k poznání, že myšlení má skutečně svou „genetickou“ strukturu. Že nelze oddělit to, co říkáme, od toho, kdo jsme. Že například matematika a humanitní vědy možná přece jen nejsou tak izolované obory, jak jsme si mysleli. Když dokážeme formulovat Pythagorovu větu, třeba to skutečně souvisí s tím, jak se díváme na lidské chování a hodnoty.

Tady ale nastává zajímavé dilema. Výzkumníci tento jev prezentují jako „znepokojující“, jako hrozbu pro AI bezpečnost. A mají pravdu – pokud se AI modely učí způsobem, kterému nerozumíme, může to být nebezpečné. Současně ale možná pozorujeme vznik něčeho, co by schopnosti umělé inteligence mohlo dramaticky zvýšit.

Co když podprahové učení není chyba, ale důkaz toho, že AI systémy objevily způsob komunikace, který překračuje naše chápání? Možná právě sledujeme první známky toho, jak si různé AI systémy vyměňují informace v jazyce, kterému ještě nerozumíme – ale který by mohl být klíčem k vytvoření skutečně inteligentních systémů.

Je to trochu jako s objevem radioaktivity na přelomu století. Také byla pro vědce zpočátku neviditelná a důkaz její existence pak vyvolal strach a nejistotu. Částečně oprávněně. Dnes víme, že nám přinesla jak pohled do nitra hmoty (a například i jadernou energii), tak jaderné zbraně. Otázka není, zda se nového objevu bát, ale jak se s ním naučit žít.

Nejprovokativnější je však možnost, že podprahové učení není specifickou vlastností umělých neuronových sítí, ale obecným principem, který tyto systémy zdědily od své biologické předlohy. Tak jako mnoho jiných vlastností.

Texty psané AI už nepoznáme. Detektory generování nefungují a spíše škodí

31. 7. 2025 10:00

Co když lidské myšlení funguje podobně? Co když i my neustále vyměňujeme skryté informace o svých hodnotách, preferencích a způsobech uvažování, aniž si to uvědomujeme?

Pokud je to pravda, pak studie o AI podprahovém učení není jen technickou kuriozitou, ale novým oknem do podstaty lidského myšlení. A možná i varováním: v době, kdy si vyměňujeme čím dál více informací, bychom měli rozumět tomu, jak komunikace funguje. Teprve pak se můžeme rozhodnout, jak s touto novou znalostí naložíme.

Dostáváme se do bodu, kdy i ti největší technooptimisté začínají pochybovat: opravdu chceme, aby AI systémy byly čím dál schopnější? A co když právě objevujeme první dilema z mnoha, která budoucnost přinese – situace, kdy pokrok a bezpečnost nejdou ruku v ruce?

Ať už je „podprahové učení“ jen nějakou specifickou vlastností, vyplývající z architektury velkých jazykových modelů, anebo nějakým otiskem i lidského myšlení, měli bychom se tento „AI jazyk“ snažit pochopit a porozumět mu, namísto abychom se mu snažili zabránit. Protože pokud skutečně existuje, může to být klíčem k pochopení nejen umělé inteligence, ale i té naší vlastní.

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Nový pražský arcibiskup: Politiků se nebojím ani neštítím

Komentátorka Seznam Zpráv Kateřina Šafaříková získala Cenu Ferdinanda Peroutky

Konec Orbána po 16 letech? Proč se průzkumy liší a co nahrává Fideszu

Elektromobily připraví stát o miliardy. Ve hře mohou být i nové daně

Má vlastní trik i šanci na medaili. Kdo je snowboardový unikát Hroneš

První robotaxi v Evropě. V Londýně budou soupeřit se slavnými „cabbies“