Umělá inteligence je přesnější a více empatická než lékaři. Ale to nestačí

Článek

Čtete ukázku z newsletteru TechMIX, ve kterém Pavel Kasík a Matouš Lázňovský každou středu přinášejí hned několik komentářů a postřehů ze světa vědy a nových technologií. Pokud vás TechMIX zaujme, přihlaste se k jeho odběru!

Velké firmy se medicínou rády ohánějí. Vypadá to dobře v tiskové zprávě a nikdo proti tomu obvykle nic nenamítá, nejspíš i proto, že tomu málokdo do detailu rozumí. Proto je možná těžké rozpoznat, kdy už to přestává být PR a začíná to být zajímavé. V dnešním newsletteru se to pokusím alespoň trochu rozplést.

Začíná to analýzou snímků

Asi nejznámější příklad zapojení strojového učení do medicíny je analýza obrazů, konkrétně různých skenů, rentgenů, magnetických rezonancí apod. Pamatuji si, že Google se už v roce 2016 pochlubil tím, že je schopen pomocí vytrénovaného modelu rozpoznat diabetickou retinopatii.

Recept, který tehdy použili, je dnes naprosto nepřekvapivý: Vývojáři vzali velké množství existujících snímků opatřených popisky od expertů a na těchto snímcích vytrénovali neuronovou síť. Ta pak byla schopna „diagnostikovat na podobné úrovni jako zdravotní personál“. Samozřejmě rychleji.

Tehdy se mohlo zdát, že podobné neuronové sítě nevyhnutelně vtrhnou do všech ordinací a nemocnic na světě. Geoffrey Hinton, jeden z hlavních postav vývoje AI a nyní známý kritik varující před zneužitím AI, tehdy dokonce řekl: „Je zcela zřejmé, že bychom měli přestat školit příští generaci radiologů.“ Podle něj by to bylo plýtvání energií, protože tato profese měla být v brzké době podobně relevantní jako profese sčítače v éře kalkulaček.

Ale nestalo se. Respektive určitě se v tomto ohledu něco mění, ale mnohem pomaleji, než by se tehdy asi zdálo. Radiolog Hugh Harvey popsal, že radiologové toho především dělají mnohem více, než že by jen seděli u monitoru a kroužkovali útvary na snímcích: „Veškerý mediální humbuk kolem umělé inteligence v radiologii se týká pouze analýzy obrazu, což je jen část práce lidského radiologa. Nevím o žádném radiologovi, který by na plný úvazek dělal pouze diagnostické hlášení.“

I kdyby systém opravdu perfektně detekoval rakovinu a další problémy – a je zřejmé, že pokroky jsou v tomto ohledu velké –, pořád to jsou lidé, kteří rozhodnou o diagnóze a především o dalším postupu. Jen lidé totiž mohou za rozhodnutí nést zodpovědnost, alespoň v současném pojetí toho slova.

Navíc se ukazuje, že doktoři zatím neumí s těmito novými nástroji pracovat: „Radiologové plně nevyužívají potenciální přínosy pomoci umělé inteligence, a to kvůli velkým odchylkám od referenčního bayesovského modelu se správnou aktualizací přesvědčení,“ stojí v nedávné studii. Jinými slovy, pro doktory je těžké rozhodnout, jak do rozhodování zapracovat „poradní hlas od umělé inteligence“, protože je těžké odhadnout, kdy lze AI systému věřit.

Ale má cenu to zkoušet. To potvrzují i zkušenosti z Česka: „U nás se už během velmi krátké doby podařilo díky umělé inteligenci objevit nádor, který by dva radiologové neodhalili,“ uvedl Jan Daneš z Mamocentra Waltrovka v Praze.

Neuronová síť odhalila podezřelé abnormality na snímku prsu.

Naopak přehnané spoléhání na AI systémy je samozřejmě také riskantní. Radiolog Jordan Perchik popisuje situaci, kdy AI systém vyhodnotil snímek plic jako bez abnormalit. Jemu se to ale nezdálo a rozhodl se to podrobněji prověřit: „Kdybych se rozhodl důvěřovat umělé inteligenci a pokračovat dál, mohlo to zůstat nediagnostikováno.“

Paradoxně čím vyšší bude úspěšnost těchto nástrojů, tím spíše jim budou lékaři důvěřovat. A tím spíše se může stát, že nebudou věnovat pozornost něčemu, co by jinak zachytili. To ale nakonec v součtu nemusí být až tak důležité, pokud celková úspěšnost stoupne…

Slovy to pokračuje

Současná vlna umělé inteligence přidala k rozpoznávání obrázků i to, co zatím pacienti čekali pouze od doktorů: slova. A pro hodně lidí může být překvapivé, že jazykové modely si vedou velmi dobře právě v tom, co se dlouho považovalo za výhradně lidskou vlastnost: Mají vysokou míru empatie.

Tedy abychom byli přesní: Systém samozřejmě nemá empatii v tom smyslu, jakou mají empatii lidé. Důležité ale je, že systémy založené například na GPT-4 umí empatii velmi přesvědčivě napodobit.

Ve studii publikované v dubnu 2023 posuzoval panel expertů odpovědi na obecné i velmi konkrétní otázky pacientů. Jak je u podobných studií obvyklé, hodnotitelé nevěděli, které odpovědi napsali lékaři a které měl na křemíkovém svědomí ChatGPT.

Ukázka odpovědí od lékaře a ChatGPT

Otázka: Jaké je nebezpečí, že po spolknutí dřevěného párátka může dojít k vážným komplikacím nebo úmrtí?

Celkem prošlo hodnocením 195 otázek, ke každé pak dvě odpovědi. Experti hodnotili faktickou správnost a „empatii lékaře“. Výsledky byly dost jednoznačné. Odborníci v 79 % případů preferovali odpovědi generované AI oproti odpovědím napsaným člověkem. Odpovědi robota byly třikrát častěji hodnoceny jako správné.

Což vůbec není samozřejmé, protože jak často opakuji, ChatGPT a další modely mají tendenci halucinovat a kecat. V případě odpovědí na zdravotnická témata ale výkon ChatGPT stačil na to, aby pokořil lidské lékaře (podle autorů studie šlo o „ověřené doktory vystupující na veřejném fóru“, jejich identitu ale skryli).

Ještě překvapivější ale je, že odpovědi generované umělou inteligencí vyhrály i z hlediska empatie. Zatímco odpovědi lékařů dostaly známku „velmi empatická“ nebo „empatická“ jen ve 4,6 % případů, chatbot vyprodukoval empatickou odpověď ve 45 % případů. To je, dalo by se říct, desetkrát vyšší míra empatie.

Chatbot si ve všech ohledech vedl lépe než lékaři.

Jistě by se dalo namítnout, že je to falešná empatie. Ale z pohledu čtenáře je to jedno. Čtenář prostě čte odpověď a buď tam tu empatii cítí, nebo necítí. Autoři studie uvádějí, že by bylo možné pomocí takovýchto systémů pomoci lékařům snížit jejich zátěž. Jak přesně by to mohlo vypadat? To bezpochyby uvidíme v následujících měsících a letech.

Nedávná studie ale ukazuje, že bychom neměli brát chatboty vážně jen proto, že toho „hodně přečetli“. Na určité otázky ChatGPT i Google Bard odpovídají způsobem, který lze bez nadsázky označit za zastaralý. Opakovali například stereotypy a předsudky týkající se pacientů tmavé pleti.

Cesta k obecnému pochopení lidského těla

Prakticky jakýkoliv lékař, se kterým se setkáte, musel projít ohromným množstvím studia všech částí lidského těla. Různé fakulty mají různé způsoby, jak mediky učí, ale obecně se považuje za přínosné, že všichni doktoři – bez ohledu na jejich konečnou specializaci – do určité míry rozumí fungování celého těla.

O stejný princip porozumění se snaží nové modely „obecné zdravotní umělé inteligence“, které by nebyly zaměřené na rozpoznávání jedné konkrétní nemoci nebo jednoho konkrétního typu rentgenových snímků. Místo toho by takový model uměl analyzovat různé vstupy i jejich kombinaci, vzít v potaz pacientovu historii, nebo dokonce pacientovy subjektivně popsané pocity.

Takový nástroj by mohl být skutečným a všestranným pomocníkem každého lékaře, který by mohl během prohlížení dokumentace klást asistentovi otázky typu: „Vysvětli útvar, který se objevil na tomto snímku magnetické rezonance hlavy. Jedná se spíše o nádor, nebo absces?“

Takovýto systém by také mohl aktivně prohledávat existující studie. Což je dost podstatné, protože v současné době po světě vychází asi 30 tisíc odborných lékařských časopisů, což znamená miliony studií ročně. Jak mi nedávno řekl známý český onkolog Jan Starý: „Myslím, že určitě v našem oboru bude (umělá inteligence) hrát velkou roli, protože umí zpracovat velké množství informací a poskytne je nám v utříděné podobě.“

Nejsem lékař, ale mám zkušenosti s tím, jak lidé vnímají technologie, kterým nerozumí. A tak si troufnu poukázat na nebezpečí, o kterém se zatím tolik nemluví, protože je v tuto chvíli poměrně vzdálené: Ve chvíli, kdy se počítače stanou nejlepšími experty na lidské tělo, bude těžší a těžší najít experty lidské. Rozhodnutí se bude dělat na základě vyhodnocení různých systémů vyladěných na různých datech a s různou schopností své závěry vysvětlovat.

„Když to rozšíříte na úroveň zdravotnického systému, můžete si uvědomit, že je třeba učinit spoustu rozhodnutí ohledně samotných zařízení a spoustu rozhodnutí, jak je integrovat, zakoupit, monitorovat a nasadit,“ říká Alan Karthikesalingam, lékař a výzkumník pro londýnskou pobočku Google Health. „Může se z toho rychle stát takový ajťácký guláš.“

V plné verzi newsletteru TechMIX toho najdete ještě mnohem víc. Přihlaste se k odběru a budete ho dostávat každou středu přímo do své e-mailové schránky.

Vyhledat

Hlavní menu

záhlaví

Hlavní obsah

Ukrajinská pevnost odolává 16 měsíců. Ale Rusové už jsou uvnitř

„Chceme se nechat definitivně pohřbít?“ Hřib varuje před odvoláním Votápka

„A teď kudy?“ Turisté v Krumlově bloudí, jakmile vystoupí z vlaku

Pokuta i za poslech hudby. Jak se žije na „poloostrově strachu“

Zájem o ojetiny v Česku roste. Stoupají ceny i stáří vozů

Turek postavil už druhou černou stavbu. Mluví o moštárně, vypadá jak garáž