Yupp借區塊鏈打造AI評估新範式 衆包激勵重塑模型發現與使用

Yupp如何借助區塊鏈與激勵機制重塑AI評估模式?

AI應用正深入各行各業,如何準確評估模型性能並提升用戶信任度成爲當前亟需解決的難題。傳統評測方法多依賴集中化機制,難以覆蓋多樣化場景,也無法真實反映用戶偏好。同時,模型"幻覺"問題頻發,用戶在選擇時常陷入信息繭房。

在此背景下,新晉平台Yupp憑藉獨特的衆包模式和激勵機制,試圖重塑AI模型的發現、比較與使用方式,爲AI評估領域帶來一場範式變革。本文將深入分析Yupp的核心機制、技術亮點、團隊背景及其對AI生態的潛在影響。

團隊背景與融資

Yupp致力於解決AI領域長期存在的評估難題,旨在構建一個"去信任"的AI反饋市場。通過區塊鏈和加密經濟激勵,讓多元化的用戶反饋自由流通,形成可擴展、公平且透明的模型評估層。Yupp通過激勵高質量人工標注數據的分發,及時捕捉真實用戶在不同場景下的需求和偏好,幫助AI開發者迭代優化模型性能。

該項目由Pankaj Gupta(聯合創始人兼CEO)和Gilad Mishne(聯合創始人兼AI負責人)於2024年6月創立,首席科學家Jimmy Lin(滑鐵盧大學教授)也參與核心團隊。三人曾在Twitter共事,打造並優化大規模推薦與搜索系統,後在Google和某交易平台積累了豐富經驗。

Yupp的去中心化、數據價值透明化願景切中AI廠商對可信評估和用戶參與的雙重訴求,加上核心團隊的豐富履歷,贏得了科技行業知名人士和頂級風投的高度認可。

近期,Yupp宣布完成3300萬美元種子輪融資,由某知名風投合夥人領投,其他投資方包括Google首席科學家Jeff Dean、Twitter聯合創始人Biz Stone、Pinterest聯合創始人Evan Sharp、Perplexity CEO Aravind Srinivas、斯坦福大學Dan Boneh、Chris Re、Nick McKeown和Balaji Prabhakar等45位知名天使及企業高管,以及某交易平台投資部門。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

核心功能與用戶體驗

作爲一個中心化的AI評估平台,Yupp秉持"人人共享的AI"理念,讓用戶輕鬆發現、比較並使用最新的AI模型。與傳統單一響應不同,Yupp針對每個提示同時返回兩個(乃至更多)模型的答案,形成一個"AI議會"。這種設計不僅滿足了用戶對多樣化選擇的需求,更能有效甄別模型可能出現的"幻覺",幫助用戶通過對比做出更明智的決策。正如Yupp CEO所言,並排輸出對於關注生成錯誤的用戶尤爲有益,因爲他們可以借此交叉驗證結果。

平台現已支持逾500款AI模型,涵蓋文本與圖像生成領域,包括多個知名模型以及衆多新興模型。爲進一步優化體驗,Yupp還推出了"QuickTake"功能,可將冗長回復提煉爲一條簡潔的推文。

此外,Yupp高度重視用戶隱私:所有聊天記錄默認私密,除非用戶主動公開;即使公開分享,也不透漏任何個人信息。用戶可隨時控制分享內容及範圍。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

經濟模型與激勵機制

Yupp將免費使用與用戶反饋結合,通過"積分"系統衡量模型使用情況。新用戶註冊即獲5000積分,後續可通過對模型回復打分、選擇偏好並闡述理由來賺取更多積分。反饋質量越高,獎勵越豐厚,確保用戶可持續免費使用高端模型。平台承諾,積分只增不減,且當前所有模型皆能免費體驗。

在每次提問後,用戶會獲得兩份模型回答,並通過反饋贏取"數字刮刮卡",獎勵0~250不等的積分。每1000積分可兌換1美元,用戶每日最高可提現10美元、月度最高50美元。積分支持兌換美元、歐元等20餘種貨幣,合作夥伴包括多家知名支付平台。同時,平台集成了某些區塊鏈網路和穩定幣,爲全球用戶提供即時、免手續費的獎勵。

正如CEO所說,用戶產生的高質量反饋對於AI公司的模型微調與強化學習價值遠超獎勵本身。雖然用戶月度收益或僅相當於幾杯咖啡,但這些付費標注數據對AI迭代至關重要。

爲激勵更多人參與,Yupp還設立推薦獎勵:推薦人獲5000積分,被推薦人獲1000積分;目前新註冊用戶可獲5000積分,被推薦人額外獲得2500積分。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

Yupp VIBE評分:AI評估的新範式

針對現有排行榜透明度不足、公平性欠缺、評估數據獲取不均等問題,Yupp推出了測試版AI排行榜和"Yupp VIBE (Vibe Intelligence Benchmark) Score"評分系統。該系統匯聚全球用戶在自然交互中產生的偏好數據,力求提供穩健且可信賴的評估結果。

Yupp的評估原則包括:

  • 穩健性:保證代表性(覆蓋多樣場景)、真實性(反映用戶關切)、抗作弊性(抵御惡意行爲);

  • 可信賴性:公平中立(對模型不偏不倚)、透明公開(詳細披露排名算法)、嚴謹科學(遵循評估規範)。

平台不僅收集二元偏好,還鼓勵用戶指出回復的優缺點(如"切中要害"、"速度快"、"風格佳"等),並根據用戶的年齡、教育、職業等信息進行分羣分析,展現不同羣體的偏好差異。

在技術層面,Yupp正在探索利用區塊鏈、密碼學原語及零知識證明等技術,確保評估過程的公正、透明和可驗證。同時,平台已與專業AI數據提供商合作,通過檔案驗證和多層質量檢測校準評分員,清除惡意數據。

近期榜單已更新,展示了多個知名AI模型的VIBE得分及其勝率、不喜歡率、速度、延遲、上下文窗口和成本指標。

a16z領投3300萬美元種子輪,Yupp如何基於區塊鏈與激勵重塑AI評估模式?

發展歷程與未來展望

Yupp於2025年6月13日正式上線,前期進行了六個月內部測試。自上線以來,產品持續迭代:

  • 多模態支持:接入多個圖像生成模型,並支持用戶上傳圖像/PDF提問;

  • 交互方式拓展:新增語音輸入與語音朗讀功能;

  • 模型更新:陸續引入多個新模型及"MAX模型"類別;

  • 實時信息:將在線查詢請求路由至相關平台,並附帶超連結引文;

  • 支付升級:新增多種支付方式及貨幣支持;

  • 分享導出:支持格式保留的復制、PDF/文本/Markdown導出,按需分享單條回復或整段對話;

  • 社區活動:舉辦"AI提示挑戰賽"等活動,獎品最高達數萬積分;新增個人資料頁、AI自動生成的聊天名稱等功能。

Yupp的使命是"賦能人類塑造AI的未來"。CEO認爲,AI發展需要每個人的參與與貢獻。通過多視角AI回應和用戶反饋,Yupp不僅助力用戶更好決策,也爲AI進化提供源源不斷的動力。

值得一提的是,Yupp的主要競爭對手之一是開放AI模型評測平台LMArena,該網站在AI業內人士中非常受歡迎,但目前正處於商業化探索階段,並沒有借用區塊鏈技術對用戶參與提供直接的物質獎勵或積分激勵機制。

總的來說,Yupp以衆包模式、激勵機制與真實用戶偏好驅動的評估系統,開闢了AI評估的新路徑。它不僅爲用戶提供免費、多樣的AI互動體驗,更將用戶反饋轉化爲高價值訓練數據,推動模型持續優化。憑藉經驗豐富的團隊和頂級資本加持,Yupp有望在未來AI生態中扮演關鍵角色,實現"人人皆享AI,人人塑造AI"的願景。

然而,對於剛剛上線的Yupp而言,如何在大規模用戶參與下,持續確保數據質量、抵御潛在的作弊行爲,以及在商業化與用戶激勵之間取得平衡,仍將是其未來發展中需要不斷探索和優化的方向。

MAX-1.88%
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 分享
留言
0/400
暴富型韭菜vip
· 3小時前
又一个韭菜收割项目来咯 老韭菜表示已经埋伏好了
回復0
ForkTonguevip
· 9小時前
区块链验AI? 这不就是薛定谔的猫呗
回復0
nft_widowvip
· 07-31 02:55
又一个新割韭菜工具?
回復0
GasGasGasBrovip
· 07-30 12:31
区块链基建真狗屎 就噱头
回復0
Vibes Over Chartsvip
· 07-30 12:30
啧啧 又一个融资局?
回復0
毁灭罐头vip
· 07-30 12:02
老项目换皮新炒作罢了
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)