豆包2.0が正式にリリースされました。
多モーダル能力を全面的にアップグレードし、さまざまなビジュアル理解タスクで世界トップレベルを達成しています。特に、ビジュアル推理、知覚能力、空間推理、長いコンテキスト理解能力が顕著であり、豆包2.0 Proはほとんどの関連ベンチマークテストで最高得点を獲得しています。
推理能力とエージェント能力の評価において、豆包2.0 ProはIMO、CMO数学オリンピック、ICPCプログラミングコンテストで金メダルを獲得し、Gemini 3 ProのPutnam Benchでの成績を超え、強力な数学的推論能力を示しています。
また、HLE-text(人類最後の試験)では最高得点の54.2点を獲得し、ツール呼び出しや指示遵守のテストでも優れたパフォーマンスを見せています。
原文表示