Grok 4.20 Reasoning 在 BridgeBench 推理基准测试中排名第一

robot
摘要生成中

ME News 消息,4 月 15 日(UTC+8),根据 WesRoth 在社交媒体上发布的消息,Grok 4.20 Reasoning 模型在竞争激烈的 BridgeBench 推理基准测试中位列第一。该模型成功超越了包括 OpenAI 的 GPT-5.4、Anthropic 的 1M-token Claude Opus 4.6 以及 Google 的一个模型在内的主要竞争对手。(来源:InFoQ)

此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论