Článek
Zhruba rok poté, co v Silicon Valley způsobil naprosté zemětřesení, představil DeepSeek testovací verze svého nového vlajkového modelu umělé inteligence. Tuto platformu s otevřeným zdrojovým kódem označuje za dosud nejvýkonnější svého druhu a otevřeně tak hází rukavici konkurenci od OpenAI po Anthropic. Napsala to agentura Bloomberg.
Čínský startup odhalil řady V4 Flash a V4 Pro, přičemž se chlubí špičkovými výsledky v testech programování a výrazným posunem v oblasti logického uvažování i úlohách autonomních agentů.
Jak společnost uvedla na platformě Hugging Face, nové modely přinášejí vylepšenou architekturu a hlubší optimalizaci. DeepSeek vyzdvihl zejména technologii, kterou nazývá Hybrid Attention Architecture. Ta má umělé inteligenci pomáhat lépe si pamatovat dotazy napříč dlouhými konverzacemi. Vývojáři navíc posunuli hranici kontextového okna na jeden milion tokenů – jde o obrovský skok, díky němuž lze do jediného příkazu vložit celé zdrojové kódy nebo rozsáhlé dokumenty.
Generace V4 přichází více než rok poté, co startup se sídlem v Chang-čou vyvolal na akciových trzích výprodeje v řádu bilionů dolarů vydáním modelu R1, tedy open-source systému, který napodobuje proces lidského uvažování. Model R1 tehdy dokázal konkurovat špičkovým systémům od společností jako OpenAI, jeho vývoj však údajně stál pouhý zlomek ceny. Investoři se proto začali ptát, jestli není vývoj v USA předražený.
Akcie čínských výrobců čipů v pátek prudce posílily, jelikož investoři sázejí na to, že nový model podpoří poptávku po domácím hardwaru. DeepSeek ve svém příspěvku na síti WeChat upozornil, že kapacita služeb pro řadu V4 Pro je v současnosti extrémně omezená kvůli kritickému nedostatku výpočetního výkonu. Startup nicméně očekává, že ceny za využívání modelu výrazně klesnou ve druhé polovině letošního roku, jakmile budou spuštěny výpočetní clustery poháněné čipy Ascend 950PR od společnosti Huawei Technologies.
Akcie společnosti Semiconductor Manufacturing International Corp. (SMIC), hlavního dodavatele čipů pro Huawei, si na hongkongské burze připsaly až 9,4 procenta, zatímco cenné papíry Hua Hong Semiconductor vyletěly o více než 13 procent. Akcie konkurenční Knowledge Atlas Technology – známé jako Zhipu – naopak oslabily o osm procent.
Nová řada představuje obrovský krok vpřed v měřítku a efektivitě, tedy ve vlastnostech, které definovaly strmý vzestup DeepSeeku a dostaly konkurenci pod enormní tlak. Po uvedení modelu R1 totiž technologické firmy i investoři začali přehodnocovat, zda má vůbec smysl nalévat do vývoje AI další miliardy dolarů. Tyto výdaje se však od té doby opět oživily a očekává se, že jen američtí technologičtí giganti investují v roce 2026 do infrastruktury pro umělou inteligenci a datových center zhruba 650 miliard dolarů.
Systém DeepSeeku využívá techniku zvanou Mixture-of-Experts, tedy „směs expertů“. Ta pro každý úkol selektivně zapojuje pouze malou část expertů (specializovaných podsítí) a díky tomuto přístupu se daří držet náklady na inferenci hluboko pod úrovní srovnatelných přelomových modelů.
Zvolená architektura a inovativní techniky staví DeepSeek do přímého střetu s nejnovějšími modely ze Silicon Valley, za nimiž stojí OpenAI, Google či Anthropic. Během pátečního oznámení se čínský startup pochlubil tím, že ve standardních testech překonává i systémy, jako je GPT-5.2 od OpenAI. Zároveň však připustil, že generace V4 za naprostou technologickou špičkou stále zaostává zhruba o tři až šest měsíců.
Přesto zástupci DeepSeeku zdůraznili, že jim nejde pouze o hrubý výkon, ale také o zásadní snižování nákladů. Model V4 je totiž od základu navržen tak, aby mohl běžet na podstatně levnější infrastruktuře.
„Nezávislí poskytovatelé modelů, jako jsou Minimax a Zhipu, budou vždy zranitelní vůči konkurenci, a to zejména ze strany internetových platforem nebo poskytovatelů cloudových služeb, kteří mají mnohem lepší dosah a distribuční sítě,“ upozornil Vey-Sern Ling, výkonný ředitel v Union Bancaire Privee. „Nakonec bude rozdíl ve výkonu modelů pro většinu uživatelů nepostřehnutelný.“
DeepSeek také vyvolal v Číně pozdvižení, když technologičtí lídři od Alibaby po Baidu zaplavili trh levnými službami v oblasti AI. Konkurenti od ByteDance po Zhipu a Minimax v týdnech před dubnem horečnatě aktualizovali své modely v naději, že DeepSeeku vypálí rybník.
S raketovým úspěchem však přišla i reakce konkurence a vlád. Američtí technologičtí lídři a vládní představitelé obvinili čínský startup, že při vývoji svých modelů využívá nelegální techniky a zakázaný hardware.
Pozornost se upírá především na takzvanou destilaci – proces, při kterém jeden AI model nelegálně využívá k tréninku výstupy jiného modelu, aby tak získal podobné schopnosti. Společnosti OpenAI i Anthropic tvrdí, že ze strany DeepSeeku zaznamenaly útoky tohoto typu, přičemž OpenAI začala tyto obavy v soukromí vyjadřovat už krátce po vydání modelu R1.
Americké AI společnosti OpenAI, Anthropic a Google kvůli tomu začaly spolupracovat, aby zabránily čínským konkurentům kopírovat jejich výsledky, napsala rovněž agentura Bloomberg. Společnosti si podle jejích informací vyměňují zkušenosti prostřednictvím neziskové organizace Frontier Model Forum, kterou tyto firmy založily společně s firmou Microsoft v roce 2023. Cílem Frontier Model Forum je odhalit pokusy typu „destilace“.
Druhým předmětem obav je podezření, že má DeepSeek přístup k embargovaným AI čipům od americké společnosti Nvidia. Tuto možnost začaly americké úřady vyšetřovat už v loňském roce.
Vláda Spojených států je na základě informací od zdrojů obeznámených se situací přesvědčena, že čínský startup ve svém datovém centru ve Vnitřním Mongolsku využíval procesory Nvidia Blackwell, na jejichž prodej do Číny se vztahuje přísný zákaz.
DeepSeek v současné době jedná se společnostmi Tencent Holdings a Alibaba Group Holding o svém prvním kole financování. Investice by firmu ocenila na více než 20 miliard dolarů (zhruba 415 miliard Kč). S odkazem na své čtyři zdroje o tom napsal web The Information.
Majitelem společnosti DeepSeek je čínský fond rizikového kapitálu Zhejiang High-Flyer Asset Management. Spoluzakladatel fondu Liang Wen-feng startup založil v roce 2023.














