Chiński startup AI wraca rok po tym, jak wstrząsnął branżą sztucznej inteligencji, oferując „światowej klasy” moc obliczeniową za ułamek kosztu innych modeli.
Chińska firma zajmująca się sztuczną inteligencją DeepSeek zaprezentowała zapowiedź swojego nowego dużego modelu językowego V4, a globalny wyścig w dziedzinie AI nabiera tempa.
DeepSeek znalazła się w ubiegłym roku w gronie najbaczniej obserwowanych firm AI po tym, jak w styczniu 2025 roku wypuściła modele, które – jak się wydawało – oferują wysoką wydajność przy niższych kosztach niż wielu amerykańskich konkurentów.
Startup z Hangzhou wprowadził model w dwóch wersjach: DeepSeek V4-Pro i DeepSeek V4-Flash. V4-Pro to większy model przeznaczony do bardziej wymagających zadań, a V4-Flash to mniejsza wersja, zaprojektowana z myślą o szybszych odpowiedziach i niższych kosztach działania.
„W testach wiedzy ogólnej DeepSeek V4-Pro wyraźnie wyprzedza inne modele open source, a nieznacznie ustępuje jedynie czołowemu zamkniętemu modelowi Gemini-3.1-Pro” – poinformowała firma DeepSeek.
Spółka podkreśla, że nowy model AI obsługuje kontekst o długości 1 mln tokenów. Oznacza to, że może przyjmować znacznie dłuższe polecenia, na przykład obszerne dokumenty czy rozbudowany kod, zanim wygeneruje odpowiedź.
W świecie AI długość kontekstu oznacza liczbę tekstu, mierzoną w tokenach, jaką model może uwzględnić jednocześnie. Większe okno kontekstu pozwala modelowi przetwarzać dłuższe wejścia i zawierać więcej informacji w każdej odpowiedzi, wyjaśnia IBM (źródło w Angielski).
„Witajcie w erze opłacalnego kontekstu 1M” – ogłosiła firma w komunikacie na platformie open source Hugging Face.
DeepSeek dodała, że V4 oferuje „światowej klasy obsługę długiego kontekstu przy drastycznie obniżonych kosztach mocy obliczeniowej i pamięci”.
DeepSeek porównał V4-Pro z konkurencyjnymi modelami OpenAI, Anthropic i Google, choć model Gemini-3.1-Pro od Google w części testów uzyskał wyższe wyniki.
Nowy model można wykorzystywać z popularnymi agentami AI, takimi jak Claude Code, OpenClaw i OpenCode, co pozwala deweloperom używać go do zadań programistycznych także poza firmowym chatbotem DeepSeek.
Znany z bardziej otwartego podejścia niż rywale oferujący zamknięte modele AI, DeepSeek udostępnił V4 do pobrania, testowania i swobodnego dostosowywania na platformie Hugging Face.
Chiński startup zwrócił na siebie uwagę pod koniec 2024 roku, gdy zaprezentował otwartoźródłowy model V3, który zaskoczył branżę AI wysoką wydajnością przy niższych kosztach i przy wykorzystaniu mniej wydajnych układów niż wielu amerykańskich rywali, w tym OpenAI i Google.
Globalny wyścig w dziedzinie sztucznej inteligencji
Na początku 2025 roku firma przyciągnęła uwagę całego świata, gdy wypuściła R1, model wnioskowania AI, który – jak twierdziła – jest tańszy, a działa równie dobrze jak duże modele językowe ChatGPT od OpenAI.
Jednak część państw zabroniła instytucjom rządowym w ubiegłym roku korzystania z DeepSeek, w tym Włochy, Stany Zjednoczone i Korea Południowa, powołując się na obawy o bezpieczeństwo narodowe.
Niemcy w 2025 roku zakazały też aplikacji DeepSeek w sklepach z aplikacjami Apple i Google, zarzucając firmie nielegalne przekazywanie danych użytkowników do Chin.
Premiera V4 nastąpiła dzień po tym, jak amerykański gigant AI OpenAI wprowadził swój najnowszy model GPT-5.5, który określił jako „najinteligentniejszy i najbardziej intuicyjny” w historii firmy.
Do premiery doszło również dzień po tym, jak Biały Dom oskarżył Chiny o kradzież własności intelektualnej amerykańskich laboratoriów AI na skalę przemysłową, z wykorzystaniem tysięcy kont pośredniczących.
OpenAI, Anthropic i Google ostrzegały w tym roku, że chińskie firmy AI, w tym DeepSeek, przeprowadzają ataki typu model extraction (MEA), znane też jako „destylacja”.
Metoda polega na zadawaniu dużemu modelowi tysięcy pytań, zbieraniu jego odpowiedzi i wykorzystywaniu ich do nauczenia nowego, mniejszego modelu podobnego sposobu „myślenia”.