DeepSeek V4 наконец-то выпущен!


Проведен сравнительный анализ
На данный момент это самая мощная открытая модель.
Достигла мирового лидерства в четырех областях: кодирование, математика, длинные тексты, агентство, некоторые показатели превосходят GPT-4o, Claude Opus 4.6.

I. Версия и позиционирование

- V4-Pro: флагман, конкурирует с GPT-4o/Opus 4.6, самая мощная в открытом доступе.
- V4-Flash: легкий и быстрый, высокая цена-качество.
- Архитектура: MoE с 1.6 трлн параметров, около 370 млрд активных при каждом запуске; контекст до 1 миллиона токенов.
- Вычислительные ресурсы: полностью на Huawei Ascend 950PR, без Nvidia.

II. Сравнение основных характеристик (по авторитетной оценке)

1️⃣ Программирование (самое сильное направление)

- HumanEval: 90% (>Opus 4.5 88%, >GPT-4 82%).
- SWE-Bench: >80%, превосходит реальные навыки программирования.
- Вывод: самый сильный AI-программист в мире.

2️⃣ Математика/логика

- MATH/STEM: превосходит все открытые модели, сравним с GPT-4o/Opus 4.6.
- Способности агента: Agentic Coding — лучший в открытом доступе, лучше Claude Sonnet 4.5, близко к Opus 4.6 (без режима размышления).

3️⃣ Длинные тексты

- Контекст: 1 миллион токенов (≈700 тысяч китайских иероглифов), входит в тройку лучших в мире (после Gemini 3.1).
- Практика: анализ романов/баз данных объемом в миллион слов без сбоев, лучший отечественный модель для длинных текстов.

4️⃣ Знания о мире

- Лидирует среди всех открытых моделей, немного уступает Gemini 3.1 Pro.

III. Общий рейтинг (на 24.04.2026)

- Первая команда закрытых моделей:
1. Gemini 3.1 Pro (лучший в логике/длинных текстах)
2. Claude Opus 4.6 (всеобъемлющий и сбалансированный)
3. GPT-4o (самая сильная экосистема)
4. DeepSeek V4-Pro (лучшее в кодировании/длинных текстах, отечественный лидер)
- Первая команда открытых моделей:
- DeepSeek V4-Pro (абсолютный лидер, превосходит Llama 3/Qwen 3 по всем параметрам)

IV. Ключевые преимущества

- ✅ Лучшее в кодировании: превосходит GPT-4o/Claude, для инженерных задач.
- ✅ Контекст 1 миллиона токенов: обработка длинных текстов — мировое лидерство.
- ✅ Отечественные вычислительные ресурсы: Ascend полностью, стоимость всего 1/70 GPT-4.
- ✅ Открытый и коммерческий: V4-Pro/Flash — открытый исходный код, лицензия MIT.

V. Недостатки

- Немного уступает Gemini 3.1/Opus 4.6 по общим возможностям (особенно в глубокой логике).
- Мульти-модальные (графика и текст) способности слабее GPT-4o/Gemini.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить