每個人都在談論Agent*可能*做到的事。但事實是——如果我們無法衡量他們在實際運作中*真正*達成了什麼,這一切都毫無意義。



這就是評估框架出場的地方。沒有堅實的基準?你基本上是在盲目飛行。

剛剛看到MAP論文,老實說,這是一個對整個Agent社群來說必須正視的現實檢查。如果你在這個領域建立,這份資料絕對是必讀的。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
HashBrowniesvip
· 12-13 03:40
飛盲狀態確實很難受,MAP那篇論文必讀
查看原文回復0
熊市搬砖侠vip
· 12-12 19:46
飛盲真的絕了,MAP紙得看看
查看原文回復0
SerumSqueezervip
· 12-11 10:53
醒目的一針見血,MAP確實戳中了痛處
查看原文回復0
暗池观察员vip
· 12-11 10:53
飛盲狀態確實得整治,MAP那篇論文確實扎心
查看原文回復0
NFT破产合集vip
· 12-11 10:52
flying blind這個說法絕了,現在確實一堆人吹Agent能做什麼,實際上連怎麼衡量都沒想清楚
查看原文回復0
独孤验证者vip
· 12-11 10:52
測什麼測,一堆紙面數據而已
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)