Hlavní obsah

Lepší než dřív. Seznam ukázal vylepšenou verzi překladače

Foto: Seznam

Ilustrační foto.

Reklama

13. 10. 9:30

Seznam vydal novou verzi svého Prohlížeče s vylepšeným překladačem. Text překládá neuronová síť, která dokáže dát cizojazyčný text do patřičného kontextu. Platforma míří k cíli přeložit několik milionů webů ročně.

Článek

​​Česká internetová jednička připravila inovaci jedné ze svých funkcí. Jde o integrovaný překladač webových stránek v aplikaci Seznam.cz. Nově je překladač napojen na neuronovou síť, díky které mají být překlady výrazně kvalitnější a srozumitelnější, než jaké byly k dispozici dosud.

Celostránkový překladač je součástí Seznam Prohlížeče od roku 2016 a Seznam na něm spolupracuje s dodavatelem jazykových technologií, brněnskou firmou Lingea. Dosavadní řešení bylo založené na frázovém překladu, který překládá zdrojový text po jednotlivých slovech nebo frázích, nepracuje s větnou stavbou či kontextem.

V oblasti strojových překladů dochází k dynamickému pokroku a frázové překladače v posledních letech nahrazují překladače založené na neuronových sítích, které napodobují činnost lidského mozku. Díky tomu, že tato technologie nepracuje s oddělenými slovy, ale s celými větnými celky, jsou výsledné překlady mnohem podobnější přirozenému jazyku, a pro uživatele proto snadněji pochopitelné.

Lingea přinesla na trh svůj vlastní neuronový překladač před několika lety a Seznam ho nyní zaintegroval do svých aplikací pro iOS a Android i do desktopového prohlížeče. Toto spojení umožňuje uživatelům brouzdat po cizojazyčných webech, jejichž překlad si mohou nechat pohodlně zobrazit přímo na otevřené webové stránce.

Za loňský rok si takto uživatelé Seznamu přeložili přes tři a půl milionů webů. „Od nového řešení si slibujeme, že se tento počet několikrát znásobí,“ říká Adam Raška, produktový manažer Seznam Prohlížeče, a dodává, že nejpřekládanější jsou především stránky zahraničních internetových obchodů a weby sociálních sítí.

Funkce překladu celých stránek je dostupná přes ikonu, která je viditelná v adresním řádku, není tedy potřeba se k překladači nijak složitě proklikávat. Pokud se navíc uživatel začte do nějaké přeložené stránky a proklikne se z ní dále, další podstránky, které si z ní otevře, se mu přeloží automaticky.

Uživatelé, kteří nestojí o překlady celých webů, ale sem tam potřebují pomoct s nějakým slovíčkem nebo frází, zase mohou využít možnost přeložit si jednotlivé slovo nebo vybraný odstavec. Prohlížeč se tak zároveň může stát účinným výukovým nástrojem.

Foto: Seznam

Ukázka překladače od Seznamu v praxi.

O vývoji automatických překladačů se v posledních měsících hojně diskutuje. Českým internetem například rezonoval vstup nové služby pro překlad DeepL, která nedávno přidala na seznam podporovaných jazyků také češtinu. V recenzích překladač doslova zazářil. Dle uživatelů a odborníků totiž překládá lépe než Google.

Produktový manažer ze Seznamu Adam Raška k tomu dodává: „Ačkoli ve výstupech jednotlivých překladačů mohou být určité rozdíly, které plynou zejména z povahy dat, na kterých se trénují, všechna řešení již nabízejí pro uživatele snadno pochopitelný text. Samotná kvalita překladu ale není to jediné, co může u uživatelů rozhodnout.“

Podle jeho slov je při vývoji důležité se zaměřit také na jednoduchost používání. Uživatelské průzkumy, které Seznam uskutečnil, totiž ukazují, že lidé na překladači oceňují právě to, že nabízí překlad přímo na otevřené webové stránce. Není tedy potřeba text nikam kopírovat, stránku si uživatel přeloží jedním kliknutím. Stejně snadno si pak může text vrátit do původního jazyka.

„Z technického hlediska pro nás tento způsob zobrazení výsledného překladu znamená těžký úkol, protože každá webová stránka je jiná a my musíme být schopni její obsah zanalyzovat a rozčlenit tak, aby se i její přeložená verze zobrazila správně a respektovala strukturu a formátování původního textu. S přechodem na neuronový překladač jsme také provedli několik optimalizací, díky kterým je nyní překladač rychlejší,“ doplnil Raška pro SZ Byznys.

Kromě automatického překladu přímo na webové stránce má překladač od Seznamu ještě další speciální funkci, kterou jiný nemá. Umí uživatelům přeložit cizojazyčné e-mailové zprávy, ačkoli seznamácké e-mailové schránky jsou na české doméně a jiné integrované překladače jejich překlad do češtiny nenabízí.

Do aplikace od původní verze přibyl také nový jazyk. Italština tak doplnila šestku podporovaných jazyků. Jak ale napovídají návštěvností data, je tato skladba pro běžný pohyb na internetu dostatečná, doplnil produktový manažer Seznamu.

„V drtivé většině případů si naši uživatelé překládají stránky z angličtiny, překladů z němčiny je o řád méně. U jazyků, jako je španělština nebo francouzština, je dokonce vidět sezónní vliv, jak uživatelé překladač využívají při plánování dovolené,“ sdělil Raška.

Jen pro srovnání – například překladač na konkurenčním Google překládá do více než 60 světových jazyků.

Na co je strojový překlad vhodný? Co zvládne lépe člověk?

Automatický překlad exceluje při překládání textů administrativního charakteru, akademických studií, zpravodajství… „Čím menší míra kreativity a čím stereotypnější vyjadřování, tím spolehlivější automatický překlad je,“ všímá si český překladatel Viktor Janiš. Stačí také všude tam, kde lidé chtěli jen porozumět nějakému textu v cizím jazyce a nejde jim o 100% výsledek.

A na co se naopak neuronové sítě (zatím) nehodí? „Obecně lze říct, že mívají problém s intertextualitou, ironií, se všemi situacemi, kdy daný jev v cílovém jazyce neexistuje, takže je třeba zvolit vhodný opis. Neumí vhodně zvolit tykání či vykání, poznat pohlaví mluvčího, odstínit sílu vulgarit či najít správnou míru hovorovosti,“ vyjmenoval Janiš v rámci srovnání technologií překladačů v článku Seznam Zpráv. „A zákonitě naprosto selhávají, když je daná pasáž přeložitelná jen tvůrčím způsobem, tedy se značným autorským vkladem. Neumí kompenzovat, překládat slovní hříčky či vtipy a samozřejmě neumí překládat poezii. Ta bude podle mě poslední nedobytnou baštou.“

Sdílejte článek

Reklama

Související témata:

Doporučované