DeepSeek представляє моделі V4: колосальний стрибок в ефективності ІІ з відкритими вагами

1

Китайська дослідницька лабораторія DeepSeek офіційно випустила прев’ю-версії своїх новітніх великих мовних моделей (LLM) – DeepSeek V4 Flash і DeepSeek V4 Pro. Цей реліз знаменує собою значну еволюцію порівняно з попередньою архітектурою V3.2 і має на меті кинути виклик домінуванню таких лідерів індустрії, як OpenAI та Google, пропонуючи високий рівень логічного мислення лише за малу частину їхньої вартості.

Масштабування: потужність архітектури Mixture-of-Experts

Обидві нові моделі використовують архітектуру Mixture-of-Experts (MoE) («суміш експертів»). Замість того, щоб активувати кожен параметр при кожному запиті — що вкрай витратно та повільно — модель MoE задіяє лише тих конкретних «експертів» (підрозділів моделі), які необхідні для виконання цього завдання. Це дозволяє досягти великих масштабів без пропорційного збільшення витрат енергії або обчислювальних потужностей.

Дві моделі суттєво різняться за масштабом:
DeepSeek V4 Pro: великовагова модель, що має 1,6 трильйона параметрів загалом, з яких 49 мільярдів активні при виконанні будь-якого окремого завдання. Це робить її найбільшою моделлю з відкритими вагами на даний момент, що значно перевершує таких конкурентів, як Kimi K 2.6 від Moonshot AI.
DeepSeek V4 Flash: більш оптимізована версія, що включає 284 мільярди параметрів, з яких лише 13 мільярдів активні за раз; вона розроблена для максимальної швидкості та ефективності.

Обидві моделі мають контекстне вікно в 1 мільйон токенів, що дозволяє користувачам обробляти величезні масиви даних, такі як цілі бази програмного коду або об’ємні юридичні документи, в рамках одного запиту.

Скорочення розриву з передовими моделями

DeepSeek стверджує, що серія V4 практично «скоротила розрив» з найпросунутішими пропрієтарними моделями світу. Аналіз продуктивності демонструє нюансовану картину того, де саме DeepSeek займає місце у глобальній ієрархії ІІ:

1. Логіка та програмування: конкурентна перевага

У спеціалізованих завданнях, таких як логічне міркування та програмування, результати DeepSeek вражають. Компанія повідомляє, що модель V4 Pro-Max перевершує більшість аналогів з відкритим вихідним кодом і навіть суперничає з топовими моделями, такими як GPT-5.4 від OpenAI та Gemini 3.0 Pro від Google у певних завданнях. У бенчмарках написання коду моделі V4 описуються як «порівняні з GPT-5.4».

2. Загальні знання: не підкорений рубіж

Незважаючи на визначні здібності до міркування, DeepSeek визнає невелике відставання в тестах на загальні знання. У цій галузі моделі на даний момент поступаються GPT-5.4 від OpenAI та Gemini 3.1 Pro від Google. Власний аналіз DeepSeek показує, що їхня траєкторія розвитку відстає від абсолютних лідерів ринку приблизно на 3-6 місяців.

3. Обмеження модальності

На відміну від «омні-моделей» (omni) від OpenAI або Google, які здатні нативно обробляти та генерувати аудіо, відео та зображення, моделі DeepSeek V4 на даний момент працюють тільки з текстом.

Революція цін: висока продуктивність за низької вартості

Мабуть, найпроривнішим аспектом релізу V4 є стратегія ціноутворення. DeepSeek агресивно демпінгує ринок, роблячи високорівневий інтелект доступним для розробників та підприємств.

Модель Вартість входу (за 1 млн. токенів) Вартість виходу (за 1 млн. токенів) Контекст конкуренції
V4 Flash $0,14 $0,28 Дешевше, ніж GPT-5.4 Nano та Claude Haiku 4.5
V4 Pro $0,145 $3,48 Дешевше, ніж Gemini 3.1 Pro та GPT-5.4

Така агресивна цінова політика свідчить, що DeepSeek конкурує як якістю інтелекту, а й економічної доцільністю масштабування ІІ-приложений.

Підсумок

DeepSeek V4 є важливою віхою для ІІ з відкритими вагами, пропонуючи колосальний масштаб і елітні можливості логічного мислення за ціною, яка кидає виклик гігантам індустрії. Хоча модель все ще трохи відстає у загальних знаннях та мультимодальних можливостях, її ефективність робить її грізним гравцем у завданнях програмування та складної логіки.

Попередня статтяПреміальний звук у дорозі: знижка 25% на Bang & Olufsen Beosound Explore
Наступна статтяMullvad VPN впроваджує ручний перемикач для боротьби з витоком даних в iOS