Článek
Analýzu si také můžete poslechnout v audioverzi.
Napřed to vypadalo, že se na tu legraci budeme v Evropě dívat jen zpovzdálí. Nástroj Veo3, který dorazil na americký trh v květnu, totiž nejprve firma Google v EU preventivně blokovala. Ale od července je model pro automatické generování k dispozici i v Česku, a to prostřednictvím chatbota Gemini, specializovaného nástroje Flow a dalších.
V úvodním videu článku vidíte, jaké taškařice se s generátorem dají dělat. Nejspíše jste ale za poslední měsíc narazili i na další vynalézavé ukázky. Díky možnosti generovat ozvučená videa tak na sociálních sítích ožívá Přemysl Oráč, kněžna Libuše, praotec Čech nebo parta pracovitých bobrů, kteří pro sprosté slovo nejdou daleko…
Jak se ale videogenerátory dají reálně využít? Co už zvládnou a co jim ještě pořád chybí? Otestovali jsme sedm aktuálních AI nástrojů a všem jsme dali stejné zadání. Sami tak můžete posoudit, jak jsou na tom. A upravit podle toho svá očekávání ohledně toho, co na vaší obrazovce je, a co není reálné.
Pokrok AI videa je ohromný
Ještě před dvěma roky byla videa z dílny umělé inteligence spíš kuriózní hříčkou. Vygenerované videoklipy připomínaly něco mezi Švankmajerovým hororem a noční můrou. Stačí si vzpomenout na tento slavný klip z března 2023, který má zobrazovat slavného herce Willa Smithe pojídajícího špagety.
Připomeňme, že statické obrázky umělá inteligence už počátkem roku 2023 zvládala poměrně solidně. Videoklipy ale byly nad její možností. Mizející postavy, ruce morfující v hlavu a obecně naprosto fluidní pohled na časoprostor znamenaly, že pro většinu praktického nasazení byly AI videa zcela nepoužitelná.
O rok později způsobil senzaci tým z OpenAI, který v únoru 2024 ukázal generátor Sora. Ukázky byly nesmírně působivé. Když si ale uživatelé koncem roku 2024 mohli produkt reálně vyzkoušet, zjistili, že šlo zřejmě o pečlivě vybrané výsledky. Sora generuje použitelné klipy spíš náhodou, a čím delší klip je, tím větší je i šance, že se scéna nějak rozpadne.
Jenže mezitím se vynořilo mnoho konkurentů. V polovině roku 2025 už máme k dispozici celou řadu AI video generátorů. Některé jsou proprietální, jiné jsou k dispozici pod překvapivě otevřenými licencemi a může je „nasadit“ kdokoli. Hodně nových generátorů pochází z Číny
Testované generátory videa
Do našeho nevědeckého testu – hodnocení necháváme hlavně na vás – jsme zařadili sedm nástrojů. Liší se schopnostmi, rychlostí, kvalitou výsledků i cenou. Dohromady ale dávají dobrou představu o tom, co současné generátory videa umí.
Pojďme se tedy podívat, jak si generátory vedly. Všem jsme dali stejné zadání a budete tak moci posoudit, jak si nástroje poradily se stejnými pokyny (tzv. prompty).
Podívejte se na kompletní přehled vygenerovaných videí:

Test generátorů videa: všechny generátory pohromadě (včetně pokynů)Video: Pavel Kasík, Seznam Zprávy, AI vizualizace
Kompletní metodické poznámky (a naše subjektivní zhodnocení) najdete na konci článku. Video je bez přidaného zvuku, jedině klipy vygenerované Veo3 obsahují zvuk. Videa jsme dále neupravovali, pouze jsme všechny klipy zvětšili na velikost 1980 × 1080.
Google Veo3 umí zvuk i video
Společnost Google patří k předním hráčům na poli generativní umělé inteligence a není tedy divu, že na svém generátoru pracují už delší dobu. Google k tomu navíc využil své eso v rukávu – k trénování neuronové sítě pro tvorbu videa využil mimo jiné i videa uložená na YouTube (což některým tvůrcům vadí).
V našem testu Veo zabodoval nejen tím, že jako jediný generuje videoklipy rovnou se zvukem. Má také poměrně dobré pochopení pokynů a výsledky jsou vysoce realistické. Většina lidí dokáže s trochou cviku generovat videa, která budou připomínat realitu.
Vidíte to taky? V následujících ukázkách si všimněte například skvěle zachyceného prostoru katedrály, podivného řezu dortu (ale za doprovodu skvělého zvuku), Prahy se dvěma Vltavami, úžasně (ne)realistického křečka, velmi realistického smažení a nakonec i děsivě vtipných slov, která mi generátor vložil do úst. A drží ten kluk za chůze kameru, nebo nedrží?
Podívejte se na to, jak si generátor Veo3 poradil s našimi pokyny:

Test generátorů videa: Google Veo 3Video: Pavel Kasík, Seznam Zprávy, AI vizualizace
Kromě toho si ale Veo zvládne i „domýšlet“ různé detaily. Třeba dialogy, zvuky nebo důsledky nějaké situace. Protože můžete (jako všem ostatním generátorům v našem textu) na začátek zadat také obrázek, ze kterého má vycházet, máte poměrně velkou kontrolu nad tím, jak bude výsledné video vypadat.
Rozhraní Gemini vám s tvorbou pokynů moc nepomůže. Experimentální nástroj Flow ale nabízí pár šikovných hraček, jak si tvorbu urychlit.

V nástroji Fow můžete skládat videoklipy za sebe a tvořit tak delší scény.
Jak se Google brání neetickému nasazení generátoru Veo3? V některých případech nástroj odmítl pracovat s fotografií obličeje. Odmítne také generovat videa z těchto kategorií: děti, celebrity, nenávist apod. Google také všechny vygenerované klipy označuje neviditelným vodoznakem SynthID, takže bude dodatečně možné jednoznačně prokázat, že nejde o reálné video.
Z testovaných nástrojů je Veo3 jednoznačně nejdražší, v externích službách vychází na 16 Kč za sekundu vygenerovaného videa. Předplatitelé Gemini AI Pro dostanou měsíčně tisíc kreditů, ale i levnější varianta Veo3 Fast spotřebuje tuto porci poměrně rychle. Kdo si chce hrát, musí si připlatit.
Překvapivě dobrý ByteDance Seedance
Už první verze čínského generátoru Seedance ukazuje, že firma ByteDance (tvůrce populární sítě TikTok) umí využít videa, která jí uživatelé za poslední roky nahráli. Generovaná videa sice neobsahují zvuk, ale co do kvality a dodržení pokynů si Seedance může s vítězem testu podat ruce.
Vidíte to taky? V následujících ukázkách si všimněte například roztomile se třesoucího křečka na padáku, dobré konzistence lidí jdoucích po ulici nebo realistických obličejů, včetně toho mého na konci.
Podívejte se, jaká videa umí generovat čínský Seedance 1.0:

Test generátorů videa: ByteDance Seedance 1.0Video: Pavel Kasík, Seznam Zprávy, AI vizualizace
Lze očekávat, že ByteDance nabídne napojení tohoto generátoru do svého editoru CapCut. Zatím jej můžete využít skrze externí platformy, my využili Fal.ai. Nastavení není nijak luxusní, lze zvolit rozlišení a délku. Maximální délka generovaného klipu je 12 sekund, takový klip vás vyjde asi na 32 korun.

Generování videí přes ByteDance Seedance 1.0 na Fal.ai
Při našich testech dokázal Seedance asi nejlépe „pochopit“ naše pokyny. I poměrně složité nápady byly ztvárněny překvapivě realisticky. Poradí si s popisem pohybu kamery, jen si musíte osvěžit anglické termíny. Odpovídá tomu momentálně vedoucí pozice na žebříčku slepého testování.
Ve svém oznámení modelu se čínská firma etikou nasazení příliš nezaobírala. Ohledně vodotisku jen podotkla, že vodotisky u zdrojových materiálů dokáže detekovat a zabránit tomu, aby „pronikly“ do cílových dat. Z trénovacích dat nicméně tvůrci vyřadili snímky označené jako pornografie, zneužívání dětí, explicitní nahota a další nevhodné materiály. Tím by mělo být zajištěno, že model nelze snadno využít ke generování takových obsahů.
Rychlý čínský MiniMax Hailuo-02
Dalším závodníkem – jejich generátor je opravdu rychlý – je model Hailuo-02 čínského startupu MiniMax. Snaží se podle svých slov o vysokou míru využitelnosti vygenerovaných klipů v praxi, třeba pro reklamy nebo pro zapojení ve videoklipech na sociálních sítích a nebo ve filmech.
Vidíte to taky? Zaměřte se na téměř realistické pohyby baletky, nádhernou hru světla a stínu průsvitného dortu, profesionálně animovaného křečka, videoblogera, který konečně drží svou kameru, vařečku měnící tvar nebo veverky mizející do propadliště.
Podívejte se, co nám vyrobil MiniMax Hailuo-02:

Test generátorů videa: MiniMax Hailuo-02Video: Pavel Kasík, Seznam Zprávy, AI vizualizace
Výsledky nebyly tak reálné jako ty od Veo a Seedance, ale kdybychom ty záběry nesledovali vedle sebe, ničeho zásadního bychom si asi nevšimli. Hailuo bodoval ve scénách, kde se pohybovalo více lidí, a dobře umí také záběry, které jako kdyby vypadly z akčního filmu. Dobře také umožňuje ovlivnit pohyb virtuální kamery, což bývá pro videogenerátory tradiční kámen úrazu.
Hailuo nabízí v našem testu asi nejlepší poměr cena/výkon. Jedna sekunda generovaného videa totiž stojí na Fal.ai jen korunu. Firma v minulosti nabídla svůj velký jazykový model jako opensource, jejich videogenerátor je ale přístupný jen přes API.
Alibaba Wan2.2 jako nečekaný skokan
V našem testu jsme původně měli zařazený videogenerátor Alibaba Wan 2.1, který vyvolal pozornost zajímavými a levnými videoklipy letos v březnu. Od té doby ale v porovnání s novými generátory působil hodně zastarale. Do testu jsme jej dali hlavně coby zástupce open-sourcových modelů, které si může kdokoli spustit u sebe nebo dále upravit.
Vidíte to taky? Určitě neunikne vaší pozornosti, že tato videa působí hodně špatně. Od rotující levitující baletky přes neviditelného křečka až po nerealistické výrazy v obličeji.
Podívejte se na výsledky generování staršího Wan 2.1:

Test generátorů videa: Alibaba Wan-2.1Video: Pavel Kasík, Seznam Zprávy, AI vizualizace
Jenže minulý týden spadla z čínské laboratoře nová verze Wan2.2, a přestože v číslování přidala jen jednu desetinku, podle výkonu je to úplně jiná liga. Model se okamžitě vyšvihl v žebříčku realistických generátorů mezi TOP10, a to jako jediný opensourcový model. Změna je vidět na první pohled.
Vidíte to taky? Jedna z nejlépe zobrazených baletek, akčně dynamický průlet ohňostrojem, mizející architektura v ulicích Prahy, vtipný zásek křečka skákajícího z letadla a možná jediný záběr mého obličeje, u kterého bych váhal, kdybych nevěděl, že je vygenerovaný.
Podívejte se na výsledky generování nového Wan 2.2:

Test generátorů videa: Alibaba Wan 2.2Video: Pavel Kasík, Seznam Zprávy, AI vizualizace
Protože jde o open-source model, může jej kdokoli zprovoznit na svém serveru či dokonce svém domácím počítači. Respektive kdokoli, kdo k tomu má technické znalosti a trpělivost, ostatní mohou využít jednu z mnoha služeb, která se o běh postará za vás.
Opensourcové modely jsou kategorie sama pro sebe. Z jistého pohledu je to vlastně to nejetičtější, co se dá v generativní AI najít, protože veškeré výsledky jsou okamžitě k dispozici ostatním. Ale tak jednoduché to není. Protože pokud je něco takto schopného a mocného k dispozici komukoli, tak to může být taky použité jakkoli a kontrola je prakticky nemožná. Doplnění vodoznaku, zákaz generování dětské nahoty – nic z toho se u opensourcových modelů prakticky nedá vynutit.
Takže pochvala takovému modelu je zároveň určitým varováním: pozor, toto je nyní výsledek, který dokáže kdokoli vyrobit – u sebe doma a za jakýmkoli účelem…
Adobe Firefly mohl být nejlepší, ale…
Americká firma Adobe je mezi grafickými designéry legendou, ačkoli už dávno nemá tak dominantní postavení jako dříve. Výrobce slavného Photoshopu naskočil na vlnu generativní umělé inteligence poměrně rychle a už v červnu 2023 ukázal, že umí zapojit novinky přímo do své vlajkové lodi. Jejich AI generátor Firefly umí vytvářet i videa. Na některé věci se hodí, jinde naopak zaostává.
Vidíte to taky? Do očí vás udeří nepřirozeně flexibilní nohy baletky, dort otevírající se kolmo na řez nožem, youtuber lapající po dechu a hlavně veverka, která mi nečekaně skočí do záběru ze studia.
Podívejte se na výsledky generátoru Adobe Firefly:

Test generátorů videa: Adobe FireflyVideo: Pavel Kasík, Seznam Zprávy, AI vizualizace
Pochvalu si naopak Firefly zaslouží za uživatelské rozhraní, které se snaží být co nejvíce nápomocné při tvrobě zadání. To je důležité, protože generování videí je přeci jen časově i finančně náročnější než generování textu a obrázků (nemluvě o spotřebě energie). Proto je dobře, že má uživatel možnost namísto psaní také nějaké věci naklikat.

Webové rozhraní pro generování videa v nástroji Adobe Firefly
Kromě nahrání prvního a posledního snímku můžete nastavit různé styly pohybu, úhly kamery nebo dokonce video pro inspiraci (podobně, jako to umí RunwayML). Uživatelé mohou také Firefly používat skrze nástroj Adobe Premiere Pro. Nástroj není dostupný skrze API, ale pouze pro předplatitele.
Firma Adobe si dává záležet, aby přistupovala ke generativní tvorbě obrázků i videa eticky. To například v jejich případě znamená, že (podle svých slov) trénují modely pouze na obsahu, který k tomu mají výslovně licencovaný. Je tedy možné, že naše stížnosti vůči méně kvalitním výsledkům jdou právě na vrub menšího množství trénovacích dat, což by byla neférová daň za etiku.
Překvapivě špatná Sora i tak něco umí
Na posledním místě v našem testu skončila chudinka Sora, generátor, který celé to nadšení kolem AI generovaných videí odstartoval. Je to ukázka toho, jak rychle se celá oblast genAI žene kupředu. Sora totiž dnes nabízí přesně to, co ukázala v roce 2024, a pár vylepšení navíc. Jenže konkurence už je dál. Videa, která padají z generátoru Sora (součást předplatného ChatGPT Plus), jsou tak sice relativně levná, ale také o úroveň pod ostatními.
Vidíte to taky? Baletce zmizí noha, dort nejde rozkrojit, křečkovi padák vyrostl ze zad, veverka přišla o hlavu a ve studiu se hýbu nejenom já, ale i můj telefon. Pražské ulice se ale docela povedly.
Podívejte se na to, co umí generátor OpenAI Sora:

Test generátorů videa: OpenAI SoraVideo: Pavel Kasík, Seznam Zprávy, AI vizualizace
Sora vyniká tím, že umí tvořit delší videa a umí je generovat relativně rychle. Také do nich vkládá „dynamický střih“. Což ale obvykle není to, co chcete.
Pokud máte čas a trpělivost, můžete využít pokročilých ovládacích prvků, které rozhraní Sora nabízí. Můžete tak třeba ovlivnit pokyny v rámci časové osy nebo mixovat více záběrů dohromady.

Rozhraní nástroje Sora umožňuje ovlivnit vygenerovaná videa na časové ose.
Jenže co je to platné, když jsou výsledné záběry obvykle nepředvídatelné a divoce se prolínají do nových. Dá se tomu vyhnout usilovným promptováním a zklidňováním výsledku. Kdyby to byl jediný dostupný generátor, asi by to nebylo tak do očí bijící. Ale v současné konkurenci už zkrátka Sora není zdaleka tak zajímavá, jako byla před rokem a půl, kdy se o ní mluvilo jako div ne o konci filmového průmyslu.
Ostatně v rámci firmy OpenAI na videogenerátoru pracuje relativně malý tým a generování videa zjevně není prioritou – tou je nyní ChatGPT a v dlouhodobém horizontu superinteligence.
Jak jsme testovali videogenerátory
Všem generátorům videa jsme zadali stejné instrukce (tzv. prompty). Některé pouze textové, jiné obsahovaly i obrázek, který musel generátor respektovat jako úvodní snímek. Vždy jsme se snažili použít výchozí nastavení, případně nastavit maximum dostupné za základní kredit. Každý nástroj měl na každý prompt jen jeden pokus.
Po vygenerování jsme všechny videoklipy upscalovali na velikost FullHD videa a posoudili výsledky z hlediska toho, jak byly naše instrukce dodrženy, interpretovány, jak je video plynulé, realistické, zda něco nemizí nebo se nepřirozeně neohýbá atd.
Videoklipy jsme pro každý úkol seřadily od nejhoršího po nejlepší. Zde se podívejte na naše subjektivní zhodnocení:

Test generátorů videa: výsledky subjektivního hodnoceníVideo: Pavel Kasík, Seznam Zprávy, AI vizualizace
Při hodnocení jsme neměli zobrazeno, které video je od kterého nástroje. Až následně jsme přidali popisky videí. Pak jsme generátorům přiřadili body od 1 (nejhorší) do 7 (nejlepší) pro každý úkol. Následující tabulka ukazuje jednotlivá skóre.
Jak generovaná videa změní svět?
Videoklipy generované umělou inteligencí už nejsou sci-fi. Jsou jich plné sociální sítě a derou se postupně i na televizní obrazovky. Pokud ještě před rokem bylo možné dát nějaké zaručené rady, jak vygenerované video poznat, nyní už si tím jistí být nemůžeme. Pokročilé generátory – včetně opensourcových – dokáží vystavět scénu, která vypadá realisticky, pohyby odpovídají tomu, co bychom čekali.
Pro lidi, kteří se dosud cítili omezeni ve své kreativitě, je to samozřejmě skvělá zpráva. Není potřeba drahé vybavení ani roky praxe, kdokoli může svoje nápady proměnit v realitu za dva večery a řádově stovky korun v AI kreditech. Znamená to, že uvidíme krásné i odporné pokusy, nenávistné i láskyplné videoklipy, propagandu i edukaci… a všechno mezi tím. Produkce profesionálně vyhlížejícího videoklipu se zkrátka letos zlevnila o řád, výhledově se pak sníží o dva.
Dopady na klasickou filmovou tvorbu ale nejspíš nebudou tak dramatické, jak by nás mohlo na první pohled napadnout. Generování desetisekundových klipů a natáčení hodinových filmů, to jsou úplně jiné disciplíny. Nepochybně se ale najde řada příležitostí pomocí AI nástrojů doplnit klasickou filmařskou tvorbu.
Větší dopad lze čekat u reklam a produktové fotografie, především u krátkých formátů. Tam už ostatně vidíme, jak se zvýšil výskyt klasických AI-generovaných obrázků a ilustrací. Nyní tedy přibydou videa. Někde snadno poznáme, že jde o generovaný klip. Jinde si tím nebudeme jistí ani po druhém přehrání. Nejspíš nám to obvykle bude jedno.
Videoobsahu bude každopádně více – a to není automaticky dobře ani pro diváky, ani pro platformy, které na divácích vydělávají. Dosud totiž řada uživatelů brala video na internetu jako určitou záruku autenticity. Reální lidé mluvící na kameru bývali alespoň nějakou garancí, že obsah nevznikl na běžícím pásu podle nějaké šablony. Tato záruka nyní padla.
Ukázka fiktivních reportáží vygenerovaných pomocí Google Veo3:

Fiktivní reportáže vygenerované pomocí AI nástroje Google Veo3.Video: Pavel Kasík, Seznam Zprávy, AI vizualizace
Videoservery pravděpodobně začnou omezovat, jak lze či nelze AI videa použít. Největší z nich – druhá nejnavštěvovanější stránka světa YouTube.com – už avizoval, že hromadné a neautentické generování obsahu pomocí AI bude důvodem pro zaříznutí monetizace daného kanálu. Což je paradoxní, vezmeme-li v úvahu, že je to právě Google, který dal uživatelům momentálně nejlepší nástroj, jak takový obsah tvořit. Další sociální sítě hledají způsob, jak označit videa, která vznikla pomocí AI.
Nelze se ale spoléhat, že nám někdo naservíruje jednoznačné označení falešných videí. Takové nástroje často vedou jen k tomu, že je člověk o to více náchylný věřit podvodům, které detekci unikly.
Až tedy uvidíme zpravodajskou relaci, kde reportér nebo reportérka informují z místa o něčem neuvěřitelném, budeme muset kontrolovat, z jakého zdroje k nám video připutovalo. Důvěryhodnost posoudíme nikoli podle toho, co vidíme na videu, ale podle zdroje.
Místo toho si musíme zvyknout, že video už není důkazem autenticity. A upravit svá očekávání ohledně toho, co na naší obrazovce je reálné a co ne.