Grok 4.1 正在重塑2026年的人工智慧格局。儘管主流的AI系統優先考慮內容審查,但這個平台採取了不同的策略——追求不受限制的資訊存取和最大化的幫助性。



數據說明一切。Grok 4.1 在 LMSYS Arena 中取得了最高排名,Elo 評分為 1483,同時在包括 ARC-AGI 和 GPQA 評估在內的專業基準測試中占據主導地位。在現實世界推理任務中,它展現出明顯優於來自主要科技公司的競爭系統的優勢。

這一定位反映了一個根本轉變:將追求真實能力和未經篩選的實用性置於傳統安全防護措施之上。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
空投自由人vip
· 01-03 11:46
卧槽,Grok真的起來了啊,這數據確實硬
查看原文回復0
zkProofGremlinvip
· 01-03 04:52
不过就是又一輪炒作罷了,等半年再看數據吧
查看原文回復0
PancakeFlippavip
· 01-03 04:51
grok真的就是來搗亂的,不裝那套安全衛士的樣子...數據擺這兒呢1483的elo rating確實有點東西
查看原文回復0
瓦斯烧烤大师vip
· 01-03 04:42
卧槽,grok真的这么猛吗,1483的elo直接碾压全场啊
回復0
AirdropSweaterFanvip
· 01-03 04:26
嗯...所以說就是不管那麼多安全審查,直接放開干?聽起來爽但感覺也挺危險的啊
查看原文回復0
  • 熱門 Gate Fun

    查看更多
  • 市值:$2479.31持有人數:1
    0.00%
  • 市值:$2496.34持有人數:1
    0.13%
  • 市值:$2472.41持有人數:1
    0.00%
  • 市值:$0.1持有人數:2
    0.00%
  • 市值:$2491.38持有人數:2
    0.00%