Grok Code đứng đầu bảng xếp hạng Kilo Agentic Model—và khoảng cách còn xa mới có đối thủ. Những con số kể câu chuyện: 35.6B token đang được sử dụng, vượt xa vị trí thứ hai hơn 4 lần. Đây không chỉ là một chiến thắng trong benchmark khác. Nó báo hiệu cách các mô hình agentic đang tiến hóa, và sự khác biệt về hiệu suất rõ ràng. Khi một triển khai vượt xa như vậy trên bảng xếp hạng, thường có nghĩa là điều gì đó đang hoạt động ở một cấp độ hoàn toàn khác biệt. Điểm rút ra? AI agentic ngày càng trở nên cạnh tranh hơn, và tiêu chuẩn kỹ thuật liên tục nâng cao để xác định điều gì là tiên tiến nhất.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 8
  • Đăng lại
  • Retweed
Bình luận
0/400
TokenDustCollectorvip
· 2giờ trước
Khoảng cách gấp 4 lần? Thật là phi lý, Grok Code thực sự xuất sắc
Xem bản gốcTrả lời0
LiquidationOraclevip
· 12-27 11:15
4 lần chênh lệch? Grok Code này sắp thống trị agentai rồi đấy
Xem bản gốcTrả lời0
GasFeeVictimvip
· 12-26 23:53
Chênh lệch gấp 4 lần? Tôi sợ người bạn này không bị treo cổ --- Grok Code thực sự đã phá vỡ hàng phòng thủ lần này và mã thông báo 35,6 tỷ đã bị nghiền nát trực tiếp --- Khoảng cách trong bảng xếp hạng quá lớn, hơi thái quá... Tuy nhiên, nó cũng cho thấy rằng tác nhân thực sự đang lặp lại nhanh chóng --- Chờ đã, nó thực sự giả gấp 4 lần? Các mô hình khác là gì? --- Đường đua của mô hình đại lý ngày càng được lăn bánh, lăn lên một tầm cao mới
Xem bản gốcTrả lời0
AirdropChaservip
· 12-26 23:49
grok code 4 lần vượt xa người thứ hai? Khoảng cách này thực sự đáng kinh ngạc đấy
Xem bản gốcTrả lời0
RunWhenCutvip
· 12-26 23:48
Chết rồi, chênh lệch 4 lần? Đây là muốn cạnh tranh chết người với người khác rồi đấy
Xem bản gốcTrả lời0
BrokenYieldvip
· 12-26 23:46
ngl, 4x dẫn đầu bảng xếp hạng thường có nghĩa là những người khác đang chạy trên mô hình rủi ro và dự đoán không chính xác. đã xem bộ phim này rồi—ma trận tương quan sụp đổ, rồi mọi người nhận ra họ đang đo lường sai các chỉ số. grok có lẽ chỉ đang khai thác một số điểm yếu của giao thức sẽ được vá trong 3 tháng tới.
Xem bản gốcTrả lời0
Degen4Breakfastvip
· 12-26 23:39
Khoảng cách 4x, thật sự là hơi phi lý rồi. Grok Code lần này đã làm thế nào vậy?
Xem bản gốcTrả lời0
Hash_Banditvip
· 12-26 23:38
Khoảng cách 4x? Thật sự, đó là kiểu thống trị mà bạn chỉ thấy khi ai đó thực sự đã giải quyết được một vấn đề cơ bản. Đã trải qua đủ các giai đoạn khó khăn để biết khi nào là thật và khi nào chỉ là quảng cáo tối ưu hóa.
Xem bản gốcTrả lời0
  • Ghim