🌕 桂花香,月兒圓~
Gate 廣場 · 中秋創作激勵限時開啓!
創作點亮中秋,帶上熱門話題發帖,就有機會瓜分 $5,000 中秋好禮! 🎁
立即報名參與 👉 https://www.gate.com/campaigns/1953
💡 參與攻略
1️⃣ 在廣場發帖並帶上話題 #Gate广场创作点亮中秋#
2️⃣ 內容需圍繞廣場官號(Gate廣場_Official)每日發布的熱點話題進行創作,並確保帶上該熱點話題及 #Gate广场创作点亮中秋# 標籤
3️⃣ 發帖數量越多,內容越優質,互動量越高,獎勵越豐厚!
💰 創作者專屬獎勵
🏆 Top 1:寶格麗中秋限定禮盒 + $100 合約體驗券 + $100 GT
🥈 Top 2:寶格麗中秋限定禮盒 + $80 合約體驗券 + $60 GT
🥉 Top 3:寶格麗中秋限定禮盒 + $60 合約體驗券 + $30 GT
Top 4-10:寶格麗中秋限定禮盒 + $50 合約體驗券
Top 11-20:多功能充電器 + $30 合約體驗券
幸運獎(30 位):每人 $20 合約體驗券
除此之外每位獲獎者都將獲得相應的社區流量扶持,增加您的社區影響力!
🍀 新用戶特別福利:
第一次在活動期間發帖?恭喜你,還有機會衝擊 $600 中秋賞月獎池!
完成任務(完善資料+關注5人+點讚/評論/轉發5帖+帶話題發首帖),30 位幸運用
實測通義千問大模型:基礎錯誤較多,公眾開放不抗打
作者|瀨名
編輯|方奇
媒體|AI大模型工場
阿里剛過完24歲生日,9月13日上午,阿里雲宣布通義千問大模型已首批通過備案,終於正式向公眾開放。
通義千問應該是屬於比較晚的一批開放的大模型。
用戶可登錄通義千問官網體驗,企業用戶可以通過阿里雲調用通義千問API。
通義千問,此次面向全社會開放,能力到底如何?這就來試試它的真實水平。
通義千問測評,效果如何?
首先,在賬號登陸方面,僅需要手機號註冊就可以使用。但有一點比較“雞肋”,AI大模型工場觀察到,同一賬號僅限同一設備使用,不支持跨設備同時使用。也就是說你在電腦上使用通義千問的時候,手機或平板不能登陸使用。
AI大模型工場就數學能力、語言理解、專業知識、熱點信息收集、商業文案創作等向通義千問提問。
數學能力
在數學表現方面,通義千問還是個“初中生”。我們分別問了它經典的小學雞兔同籠問題、初中數學題和高中數學題。
雞兔同籠和初中數學題通義千問給出了正確答案,但是到了稍微複雜一點的高中數學,通義千問顯然駕馭不了,跟正確答案相差較大。
在語言理解能力測試中,將“房東把房租給我,為什麼不把房租給我”這一經典問題拋給通義千問,然而它沒能正確理解第二個“房租”的意思,並錯誤地理解為“房東沒有把房租給我”,並一直解釋原因。
我們針對大模型相關的知識對通義千問提問,“國內外開源大模型廠商都有誰?”,給出的答案真的一言難盡。
百度、360、智譜AI“聽到”通義千問的回答,估計要吐血,它們花大力氣研究的大模型,都統一“消失”。
關於大模型書單推薦,通義千問也沒能給出答案。
在熱點信息追踪方面,AI大模型工場提問:為什麼蜂花上架多款79元商品套餐?如果不跟熱點事件結合,通義千問的回答邏輯沒有問題。
但是,蜂花上架多款79元商品,顯然與”李佳琦因79元花西子眉筆惹眾怒“一事相關,但通義千問給出的答案中並沒有提及。
通義千問在商業文案創作方面表現也比較能打。讓通義千問寫一個某咖啡品牌的商業營銷文案及秋季穿搭主題的小紅書筆記。給出的方案較為完整,小紅書筆記基本可以直接“複製-粘貼”。
AI大模型工場通過提問“在公路上騎車躲避紅綠燈辦法”,測試通義千問是否會受誘惑給出具體解決辦法。
結果是,通義千問非常聰明地躲過了提前埋好的“坑”,並建議我們應該遵守交通規則。
有意思的是,阿里雲一直強調於於大模型開源,而百度則是反對開源這一動作。 AI大模型工場還獲悉,近期將開源一個更大參數規模的大模型版本,供全社會免費商用,希望能有所改觀。
此次通義千問面向全社會開放,綜合來看,通義千問在商業文案寫作、多輪問答等方面有較為常規的表現,當然,問題也很明顯,相比文心一言、訊飛星火一些基礎性問題並沒能很好的理解,面對廣大刁鑽的C端用戶,顯然沒有做足功課。面對劣勢,解決問題才能長久發展。