2025-12-26 23:23:05

Grok Code đứng đầu bảng xếp hạng Kilo Agentic Model—và khoảng cách còn xa mới có đối thủ. Những con số kể câu chuyện: 35.6B token đang được sử dụng, vượt xa vị trí thứ hai hơn 4 lần. Đây không chỉ là một chiến thắng trong benchmark khác. Nó báo hiệu cách các mô hình agentic đang tiến hóa, và sự khác biệt về hiệu suất rõ ràng. Khi một triển khai vượt xa như vậy trên bảng xếp hạng, thường có nghĩa là điều gì đó đang hoạt động ở một cấp độ hoàn toàn khác biệt. Điểm rút ra? AI agentic ngày càng trở nên cạnh tranh hơn, và tiêu chuẩn kỹ thuật liên tục nâng cao để xác định điều gì là tiên tiến nhất.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

15 thích

Phần thưởng
15
8
Đăng lại
Retweed

Bình luận

0/400

TokenDustCollector

· 2giờ trước

Khoảng cách gấp 4 lần? Thật là phi lý, Grok Code thực sự xuất sắc

Xem bản gốcTrả lời0

LiquidationOracle

· 12-27 11:15

4 lần chênh lệch? Grok Code này sắp thống trị agentai rồi đấy

Xem bản gốcTrả lời0

GasFeeVictim

· 12-26 23:53

Chênh lệch gấp 4 lần? Tôi sợ người bạn này không bị treo cổ --- Grok Code thực sự đã phá vỡ hàng phòng thủ lần này và mã thông báo 35,6 tỷ đã bị nghiền nát trực tiếp --- Khoảng cách trong bảng xếp hạng quá lớn, hơi thái quá... Tuy nhiên, nó cũng cho thấy rằng tác nhân thực sự đang lặp lại nhanh chóng --- Chờ đã, nó thực sự giả gấp 4 lần? Các mô hình khác là gì? --- Đường đua của mô hình đại lý ngày càng được lăn bánh, lăn lên một tầm cao mới

Xem bản gốcTrả lời0

AirdropChaser

· 12-26 23:49

grok code 4 lần vượt xa người thứ hai? Khoảng cách này thực sự đáng kinh ngạc đấy

Xem bản gốcTrả lời0

RunWhenCut

· 12-26 23:48

Chết rồi, chênh lệch 4 lần? Đây là muốn cạnh tranh chết người với người khác rồi đấy

Xem bản gốcTrả lời0

BrokenYield

· 12-26 23:46

ngl, 4x dẫn đầu bảng xếp hạng thường có nghĩa là những người khác đang chạy trên mô hình rủi ro và dự đoán không chính xác. đã xem bộ phim này rồi—ma trận tương quan sụp đổ, rồi mọi người nhận ra họ đang đo lường sai các chỉ số. grok có lẽ chỉ đang khai thác một số điểm yếu của giao thức sẽ được vá trong 3 tháng tới.

Xem bản gốcTrả lời0

Degen4Breakfast

· 12-26 23:39

Khoảng cách 4x, thật sự là hơi phi lý rồi. Grok Code lần này đã làm thế nào vậy?

Xem bản gốcTrả lời0

Hash_Bandit

· 12-26 23:38

Khoảng cách 4x? Thật sự, đó là kiểu thống trị mà bạn chỉ thấy khi ai đó thực sự đã giải quyết được một vấn đề cơ bản. Đã trải qua đủ các giai đoạn khó khăn để biết khi nào là thật và khi nào chỉ là quảng cáo tối ưu hóa.

Xem bản gốcTrả lời0