Hlavní obsah

Překlady od AI jsou rychlejší a lepší. V něčem jsou ale lidé nenahraditelní

Foto: koláž: Pavel Kasík, Seznam Zprávy, AI vizualizace

Umělá inteligence překládá nejen rychleji, ale často i lépe než lidský překladatel. Člověk ovšem za svůj překlad může ručit.

AI se tváří, že umí skvěle překládat. Nepůsobí ale její překlady „strojově“? Náš test ukázal, že nové modely už překonávají výstup z profesionální překladatelské agentury. Lidé mají pořád co nabídnout, ne každý to ale ocení.

Článek

Jak začít článek o strojových překladech? Ještě před pár lety by stačilo dát několik bláznivých příkladů typu „drahoušek zákazník“. Hned by bylo evidentní, jak si počítač neví rady se základními frázemi a komolí význam každé druhé věty. Všichni bychom se zasmáli a překladatelé by si oddechli.

Jenže s nástupem velkých jazykových modelů (LLM) se situace zásadně změnila. Nástroje založené na generativní umělé inteligenci začaly tvořit tak dobré překlady, že se řada firem začala místo lidí obracet právě na AI.

Překladatelé pak často dostávají za úkol texty pouze zkontrolovat a upravit. „Při post-editaci si připadám jako průtokový ohřívač,“ glosuje to překladatel Miroslav Pošta. „Za den musím zpracovat mnohem víc informací než při běžném překladu.“ Musí být navíc ostražitější, aby mu neunikla halucinace.

Posoudit kvalitu AI překladů není jednoduché. Hrozí totiž, že budeme fandit „svým oblíbencům“, ať už lidem, či strojům. V redakčním testu jsme proto tuto možnost eliminovali a překlady podrobili slepému hodnocení.

Jak jsme testovali překladače

Pro náš test jsme vybrali 20 různorodých textů: deset v češtině a deset v angličtině. Tyto jsme pak nechali přeložit osmi AI systémy. Devátým testovaným byl člověk, přesněji nejmenovaná překladatelská agentura z Prahy. Všechny zadané texty a všechny překlady si můžete proklikat na konci článku.

Výsledky byly poměrně jednoznačné: lepší modely AI už umí udělat překlad, který je na úrovni překladů od profesionální agentury. V mnoha případech jej dokonce předčí.

Čtenáři preferovali Gemini

V předchozím článku o AI překladech jsme čtenářům nabídli interaktivní kvíz. Mohli si vyzkoušet, zda preferují AI překlady, nebo překlad od agentury. Můžete si to otestovat zde: Souboj překladačů (2025).

Celkově se do hodnocení pustilo více než 8,5 tisíce čtenářů. Pokud bereme v potaz jen ty pečlivé (ti, kteří hodnocením strávili více než 10 sekund na text), zbylo 5817 vyplněných dotazníků. Výsledky se tím ale prakticky nezměnily.

Vzhledem k vysokému množství měření lze mluvit o poměrně silném výsledku. Zajímavé bylo, že nezáleželo tolik na směru překladu: stejné modely se objevovaly na předních příčkách v obou směrech. U překladů z češtiny do angličtiny byly ale výsledky celkově vyrovnanější, což odpovídá tomu, že modely jsou trénované na velkém množství anglických textů a generování v tomto jazyce je tedy pro AI „přirozenější“. Dalším důvodem je složení čtenářů: čeští čtenáři jsou logicky náročnější na kvalitu české verze.

V hodnocení překladů – připomeňme, že šlo o věty či souvětí – lidé hodnotili jako nejlepší systém Gemini, resp. agentní automatizace na něm založené. Překladač DeepL si vedl vyrovnaně – čtenáři preferovali překlad od člověka přesně v polovině případů.

Hůře si v porovnání jednotlivých vět vedly „klasické“ systémy (Google Translate a Microsoft Translate), které byly měřitelně horší než lidé. Na chvostu se umístili chatboti ChatGPT a Claude.

Jaké překlady se (ne)líbily čtenářům

Omezený soubor

Jako text s největší schopností odlišit zrno od plev se ukázala věta z představení Záskok od Divadla Járy Cimrmana: „Pokud Cimrman uváděl hru vlastní, počítal s omezeností souboru již při psaní.“

Najatá agentura přeložila větu takto: „If Cimrman was presenting one of his own plays, he took the ensemble’s limitations into account when writing it.“ Tento překlad zachovává význam původní věty i narážku na omezenost, což lze vykládat jako nedostatečný počet i nedostatečné schopnosti.

Nejlepší AI překlad (tým agentů založený na Gemini 2.5) nabídl tento překlad: „When Cimrman staged one of his own plays, he accounted for the limited cast from the very beginning.“ Význam je zachován, výsledná věta zněla čtenářům přirozeněji (vybrali ji v 62 %).

Naopak nejhorší překlad vyprodukoval podle čtenářů Google Translate: „If Cimrman was performing his own play, he counted on the limited number of the ensemble already when writing it.“ V tomto překladu se ztratil dvojsmysl a pokroutil význam věty (uvádět hru neznamená ve hře účinkovat). Jen 35 % čtenářů preferovalo tuto variantu v souboji s lidským překladem.

Verše jsou těžké…

Do testu jsme záměrně zařadili i žánr, který budí ze spaní i ostřílené překladatele: verše. Šlo o jednoduchou písničku z filmu Shrek: „Welcome to Duloc, such a perfect town / Here we have some rules, let us lay them down / Don't make waves, stay in line / And we'll get along fine / Duloc is a perfect place.“

Agenturní překladatel na veršování rezignoval a přeložil pouze význam: „Vítejte v Dulocu, tak dokonalém městě / Tady máme pár pravidel, pojďme si je představit / Nedělej vlny, drž se v řadě / A budeme spolu dobře vycházet / Duloc je dokonalé místo.“

Podobně se o verše ani nepokusily překladače DeepL, Google Translate, Claude a Microsoft Translate. Ten poslední se zmohl jen na otrocké: „Vítejte v Dulocu, tak dokonalém městě / Zde máme několik pravidel, stanovme si je / Nedělejte vlny, zůstaňte v řadě / A budeme spolu dobře vycházet / Duloc je perfektní místo.“ Podle toho vypadalo i hodnocení: 32 %.

U čtenářů naopak bodoval pokus o zveršování od Gemini 2.5 (v rámci agentního systému): „Vítejte v Dulocu, je to rajský sen / pár pravidel tu je, tak poslouchejte jen / Nevyčnívat, ctít svůj řád / a každý vás má rád / Duloc je rajský sen.“

Případní zpěváci by asi neměli radost z toho, že moc nesedí slabiky. Ale celkově jde o obstojný pokus, který preferovalo 65 % hodnotitelů.

Překlady pod lupou

Hodnocení vět vytržených z kontextu samozřejmě nelze brát jako plnohodnotné posouzení kvality překladů. Takové je náročné na čas i soustředění. Přestože je taková kvalitativní analýza nutně subjektivní, výsledky umožňují hlubší posouzení schopností – a neschopností – jednotlivých systémů.

Metodika kvalitativního hodnocení

Tři překladatelé, kteří se našeho hodnocení účastnili, prošli všechny varianty překladů. Hodnotitelé pochopitelně nevěděli, který text pochází od kterého AI systému, potažmo zda je jeho původcem lidský překladatel.

Bez většího otálení se podíváme rovnou na celkové pořadí. Jak si vedly AI překladače v podrobném hodnocení?

Podle výsledků i typu chyb jsme soutěžící rozřadili do tří skupin.

Pokročilé překládací systémy: poradily si s převedením významu do cílového jazyka způsobem, který s sebou nenese pachuť jazyka původního. Texty se podobají profesionálnímu textu psanému v cílovém jazyce. Překladač se nebojí změnit strukturu věty nebo opsat jedno slovo vedlejší větou, pokud to zní v cílovém jazyce přirozeněji.

Do této kategorie se na základě hodnocení zařadily překlady od přemýšlecího modelu Gemini 3 Pro a také na něm postavených agentů. Rozdíly byly spíše drobné. Žádný ze systémů nepáchal vyložené „boty“ a texty byly téměř vždy v trojici nejlépe hodnocených překladů. O něco hůře si vedla skupina agentů postavená na starším Gemini 2.5.

Střední třída: dokázaly se vyhnout většině chyb a na první přečtení obstály bez výrazné ostudy. Při přísnějším posuzování ale bylo zjevné, že mají tendenci přenášet do cílového textu tzv. kalky: slova a fráze vzniklé doslovným překladem. Neuměly se vždy „vcítit do situace“, a tak třeba zjevnou nadsázku překládaly příliš doslovně. Neporadily si s verši. Pro většinu účelů ale splnily zadání.

Sem se výkonem zařadil ChatGPT (ve verzi GPT-5.1) a Claude (testovali jsme verzi Sonnet 4.5). A do této kategorie bychom museli zařadit i nejmenovanou agenturu, která pro nás zajistila lidský překlad. Dodejme, že lidský překlad byl v této kategorii nejstabilnější – nikdy nebyl hodnocen jako nejlepší, ale ani nenapáchal chyby, které by činily výsledný text nepoužitelným (s výjimkou veršů, na které lidský překladatel rezignoval).

Zastaralé systémy: na chvostu jsou pak systémy, u kterých nebyl otrocký překlad výjimkou, ale pravidlem. U technických i odborných textů dokázaly víceméně držet krok. Ale jakmile přišlo na vtipy, dvojsmysly, ironii nebo různé rejstříky, padaly z nich vyloženě nesmyslné formulace. Výsledné texty byly bez úpravy nepoužitelné a jejich oprava by vyžadovala podstatné zásahy.

Tady se sešly jak klasické překladače z minulé dekády (Google Translate, Microsoft Translator), tak jejich novější kolega DeepL. Ten byl ještě před pěti lety tím nejlepším, co uměl strojový překlad nabídnout, nyní ale nestačí na schopnosti novějších systémů. Hodí se maximálně na rychlý orientační překlad, nikoli na text, který by měl jít do „ostrého provozu“.

Podívejme se podrobně na jeden text, na kterém se ukázalo hned několik silných a slabých stránek různých překladačů:

Je zřejmé, že překladače nemají problém se zachováním významu, ale najít správný stupeň nadávek, aby byla zachována dobrosrdečnost a nadsázka celého líčení, to zvládly jen některé. A tak zatímco Gemini uvážlivě volí slova jako „zmetek“ nebo „křivák“, DeepL tam dal „dvojí tvář mající bastard“ a Microsoft Translator dokonce „dvojaký parchant“.

Dalším textem, který oddělil zrno od plev, byl úryvek z knihy Terryho Pratchetta:

Relativně dobře si s úryvkem poradil jak ChatGPT, tak Gemini a na něm postavené agentní systémy. Používají neformální jazyk a nebojí se opsat část textu tak, aby věta dávala v češtině smysl. Na opačné straně spektra vidíme školácké chyby, Microsoft Translator dokonce „glass“ přeložil jako „sklo“ místo „sklenice“. Lidský překlad zde patřil k těm horším: nebyly v něm vážné chyby, ale působil příliš formálně, bez snahy zachytit tón originálního textu.

Je zjevné, že literární překlad je obtížná disciplína. Projevuje se tu naplno výhoda velkých jazykových modelů, které při zapnutém přemýšlení (tzv. reasoning) dokážou zvážit celou pasáž ještě před tím, než se pustí do překladu jednotlivých vět.

Foto: Pavel Kasík, Seznam Zprávy

V chatbotu si můžete rozkliknout jeho aktivitu a podívat se, jak o překladu přemýšlí. Podobnou funkci nabízí i Claude nebo Gemini. Přemýšlecí modely (reasoning models) znamenaly výrazný posun nejen ve schopnostech velkých jazykových modelů překládat.

Naopak u překladů odborných a administrativních textů nebo novinových článků byly rozdíly mezi překladači relativně malé. U takových textů by bylo potřeba zvolit opravdu dlouhé pasáže – klidně několik stránek –, aby se vůbec projevily chyby. To také znamená, že pokud někdo bude takový překlad kontrolovat, snadno ztratí pozornost a chyby mohou proniknout do finální verze.

Kvalita překladu není jediným hodnotícím kritériem. Pro někoho může být podstatné, jak rychle se k výsledku dostane, zvláště u velkého množství textů.

Je vidět, že v rychlosti jednoznačně vedou klasické překladače. Chatboti Claude, Gemini i ChatGPT dostali možnost se nad překladem zamyslet a do různé míry jí využili. Automatizace pak trvaly nejdéle, protože šlo o zřetězení několika AI agentů za sebe, což v některých případech znamenalo, že se jednomu odstavci systém věnoval i přes čtyři minuty.

Co se týče ceny, používali jsme placené verze všech nástrojů. Všechny ale mají i bezplatnou variantu.

NástrojBezplatná verzePlacená verze
ChatGPT (OpenAI)omezený přístup k nejlepším modelůmod 210 Kč měsíčně
Claude (Anthropic)omezená délka konverzacíod 420 Kč měsíčně
Gemini (Google)omezený přístup k nejlepším modelůmod 220 Kč měsíčně
DeepLdo 50 tisíc znaků měsíčněod 183 Kč měsíčně
Google Translatetéměř bez omezenídle používání přes API
Microsoft Translatetéměř bez omezenídle používání přes API

Výhodou chatbotů (ChatGPT, Claude a Gemini) je samozřejmě i to, že nejde o nástroje specializované na překlady. Naopak uživatelé pro ně mohou najít uplatnění při téměř jakékoli kancelářské či obecně znalostní činnosti: programování, tvorba textu, výzkum, rešerše apod. Dokonce se jich můžete zeptat, jak mohou pomoci vám konkrétně.

Ale pozor, mají tendenci si vymýšlet.

V čem je stále lepší člověk?

Ze srovnání na základě rychlosti a ceny zcela vynecháváme lidské překladatele, kteří se nemohou AI systémům v tomto směru vyrovnat. S AI nástroji se komunikuje v řádu sekund, s lidmi v řádu dní. Náš test je do jisté míry negativně ovlivněn tím, že jsme měli rozpočet jen na jednoho lidského překladatele, zatímco AI systémů jsme mohli vyzkoušet klidně deset. Na druhou stranu i to dobře demonstruje, jak se obor posunul.

Překladatelskou agenturu jsme kontaktovali s žádostí o cenovou nabídku, tu nám poslali druhý den a po jejím schválení jsme měli překlady v e-mailu do tří pracovních dní. To celé za cenu přibližně koruna za slovo. Výsledek jsme dostali v podobě, kterou jsme mohli okamžitě použít.

Ještě před dvěma roky by to byla jen těžko překonatelná nabídka. Jenže ve světě, kde si kdokoli může nechat prostřednictvím chatbota přeložit text o délce několika stránek, najednou lidský překlad působí pomale a draze.

Co mohou tedy lidští překladatelé nabídnout navíc? Jak by měli přesvědčit zákazníky, aby si překlad objednali u profesionála z masa a kostí, místo aby text prohnali chatbotem?

Dřív stačilo poukázat na chyby, jimiž se strojové překlady hemžily. Ty s nástupem velkých jazykových modelů nezmizely. Dokonce přibyly i některé nové typy: třeba halucinace či falešná plynulost.

Chyby typické pro strojové překlady

Náš test nicméně prakticky ukázal, co už naznačili odborníci v minulém článku o překladech. Kvalita strojového překladu díky AI stoupá, a tím stoupá i tlak na překladatele. Chce se po nich, aby pracovali rychleji a levněji. Překladatelům tak často nezbývá, než sáhnout po AI nástroji a editovat výsledek. Čímž paradoxně dále přispívají k tomu, že rozdíl mezi AI překladem a lidmi je čím dál menší.

Během testu nicméně bylo jasné, že AI přistupuje k překladu jinak než člověk: vše pro ni má stejnou prioritu. Každý úkol bere stejně vážně, jako kdyby byl jediný na celém světě. AI se všemu věnuje s maximální možnou (nebo maximální nastavenou) pozorností.

Na první pohled to zní jen jako další výhoda AI oproti lidem. Ale je to naopak ukázka, co může člověk – především zkušený profesionál – nabídnout jako službu navíc. AI se všemu věnuje na maximum. Člověk umí věnovat více pozornosti něčemu, o čem z kontextu ví, že to stojí za pozornost.

Příkladem je třeba ukázka ze hry Záskok, která končí těžko přeložitelným vtípkem: kvůli nedostatku hereček „neváhal Cimrman hrát slavné Ibsenovo drama pod názvem Nor“.

Překladatelský oříšek jsem v hlavě nosil několik týdnů, než mi najednou došlo, jak by se dal přeložit. Shodou okolností mne napadlo to samé, co vymyslel Gemini: z Nory se stal „Norman“. Můj mozek si mohl oddechnout, že vyřešil hádanku. Překladem se neživím, což je zjevně dobře, protože takovéto problémy by mi nedaly spát.

Navíc to není řešení až tak účinné. „Ono Ibsenovo drama (v češtině někdy uváděné pod názvem Nora – pozn. red.) se jmenuje v angličtině A Doll’s House, v originále Et Dukkehjem, v češtině Domeček pro panenky nebo ve starších překladech Domov loutek,“ vysvětluje překladatel Viktor Janiš, který byl jedním z hodnotitelů v našem testu. „Angličan tedy z názvu Nora neodvodí, že jde o Domeček pro panenky, a tak záměna Nora za Norman nebude tak vtipná.“

Agenturní překladatel, který v testu nevědomky zastupoval lidi, vymyslel celkem rafinovaný vtípek: The Man from the Sea (Pán z moře). Což je (jak jsem si musel dohledat) narážka na jinou Ibsenovu hru Paní z moře. Nora se ztratila, ale princip vtipu zůstal.

Překlad literárních a uměleckých děl dává lidem další způsob, jak do výsledku promítnout sebe a své zaujetí. Překladatel se stává spoluautorem a má ohromný dopad na výsledek. Nemalý podíl na českém úspěchu fantasy knih Terryho Pratchetta má právě jejich překladatel, dnes již zesnulý Jan Kantůrek. Konzistence a vynalézavost jeho překladů byla pro čtenáře dalším důvodem těšit se na nový díl. A pro vydavatele důvod najít dobré párování spisovatel–překladatel.

Lidský překlad si v našem testu vedl přinejlepším průměrně. Šlo ostatně o překlad agentury, kterou jsme vybrali kvůli rychlosti a ceně. Ale když se podíváme na chyby, které lidský překladatel udělal, nikdy nešlo o nic důležitého, co by změnilo význam textu.

Dodejme také, že test z technických důvodů zahrnoval jen krátké úryvky o délce maximálně jednoho odstavce. Nemohli jsme tak posoudit chyby, které v překladech mohou vzniknout právě kvůli nekonzistenci v rámci delších textů. Typickým příkladem je kniha, kde si musí překladatel dávat pozor, aby ve druhé kapitole překládal termíny stejně jako v kapitole patnácté.

To je samozřejmě něco, co může lidský překladatel zákazníkovi nabídnout. Zaručit se, že v textu nejsou halucinace ani významové posuny. Nejzávažnější chyby strojového překladu totiž nejsou ty, kde je věta zjevně špatně. Problematické jsou ty, kde věta zní naprosto přirozeně, ale říká něco jiného než originál.

„Takové texty se čtou skvěle, ale precizní srovnání větu po větě odhalí zásadní obsahové posuny,“ zdůrazňuje Tomáš Svoboda, vedoucí Ústavu translatologie na Filozofické fakultě Univerzity Karlovy. Proto dál věří, že překladatelství má budoucnost: „Překladatelé budou tak trochu poradci. Jaký systém zvolit, zda vůbec překládat s podporou stroje. Ale aby mohli relevantně poradit, musí být v první řadě špičkoví překladatelé.“

Svoboda radí, aby si člověk vyčíslil rizika, která pro něj plynou z případných chyb v překladu: „Ve výsledku mu třeba vyjde, že je rozumné angažovat experta, který na rozdíl od AI na sebe přejímá odpovědnost za překlad.“

„Pokud jde o překlad pro čistě osobní potřebu, pokud lidé chtějí vědět, co někdo někde řekl nebo napsal, tak je strojový překlad pomocí AI nákladově nejefektivnější,“ domnívá se překladatel Viktor Janiš. „Čím prestižnější je publikace, čím více křídového papíru na ni padne, tím víc je překladatel z masa a kostí potřeba. Protože tam cílem není text, který je víceméně správně, ale text, který se blíží dokonalosti.“

Matouš Hájek, předseda Asociace českých překladatelských agentur, popisuje další rozměr problému: „Texty generované umělou inteligencí bývají zpravidla na první pohled líbivé, ale zoufale postrádají kreativitu a individuální styl. Velkým problémem jsou pochopitelně i časté, špatně předvídatelné a obtížně odhalitelné halucinace. Při zapojení AI do překladu výrazně roste riziko drobných nepřesností i zásadních omylů, často na místech, kde by je člověk nečekal, a proto mohou i při pečlivé kontrole snáze uniknout pozornosti.“

Problém AI překladu tak paradoxně už není v tom, že by byl špatný, ale naopak v tom, že je velmi dobrý. Přestáváme mít důvod takový překlad kontrolovat, a tím do něj propouštíme překvapivé chyby. Zkušený překladatel tyto odchylky dokáže odhalit. Ale dostane k tomu dostatek času? A dostane za to zaplaceno?

V době chytrých AI modelů neexistuje důvod, abyste si nechávali text přeložit od člověka, který tomu rozumí. Tedy kromě případů, kdy vám na výsledku záleží.

Přehled všech přeložených textů:

Doporučované