🌕 桂花香,月儿圆~
Gate 广场 · 中秋创作激励限时开启!
创作点亮中秋,带上热门话题发帖,就有机会瓜分 $5,000 中秋好礼! 🎁
立即报名参与 👉 https://www.gate.com/campaigns/1953
💡 参与攻略
1️⃣ 在广场发帖并带上话题 #Gate广场创作点亮中秋#
2️⃣ 内容需围绕广场官号(Gate广场_Official)每日发布的热点话题进行创作,并确保带上该热点话题及 #Gate广场创作点亮中秋# 标签
3️⃣ 发帖数量越多,内容越优质,互动量越高,奖励越丰厚!
💰 创作者专属奖励
🏆 Top 1:宝格丽中秋限定礼盒 + $100 合约体验券 + $100 GT
🥈 Top 2:宝格丽中秋限定礼盒 + $80 合约体验券 + $60 GT
🥉 Top 3:宝格丽中秋限定礼盒 + $60 合约体验券 + $30 GT
Top 4-10:宝格丽中秋限定礼盒 + $50 合约体验券
Top 11-20:多功能充电器 + $30 合约体验券
幸运奖(30 位):每人 $20 合约体验券
除此之外每位获奖者都将获得相应的社区流量扶持,增加您的社区影响力!
🍀 新用户特别福利:
第一次在活动期间发帖?恭喜你,还有机会冲击 $600 中秋赏月奖池!
完成任务(完善资料+关注5人+点赞/评论/转发5帖+带话题发首帖),30 位幸运用
实测通义千问大模型:基础错误较多,公众开放不抗打
作者|星奈
编辑|方奇
媒体|AI大模型工场
阿里刚过完24岁生日,9月13日上午,阿里云宣布通义千问大模型已首批通过备案,终于正式向公众开放。
通义千问应该是属于比较晚的一批开放的大模型。
用户可登录通义千问官网体验,企业用户可以通过阿里云调用通义千问API。
通义千问,此次面向全社会开放,能力到底如何?这就来试试它的真实水平。
通义千问测评,效果如何?
首先,在账号登陆方面,仅需要手机号注册就可以使用。但有一点比较“鸡肋”,AI大模型工场观察到,同一账号仅限同一设备使用,不支持跨设备同时使用。也就是说你在电脑上使用通义千问的时候,手机或平板不能登陆使用。
AI大模型工场就数学能力、语言理解、专业知识、热点信息收集、商业文案创作等向通义千问提问。
数学能力
在数学表现方面,通义千问还是个“初中生”。我们分别问了它经典的小学鸡兔同笼问题、初中数学题和高中数学题。
鸡兔同笼和初中数学题通义千问给出了正确答案,但是到了稍微复杂一点的高中数学,通义千问显然驾驭不了,跟正确答案相差较大。
在语言理解能力测试中,将“房东把房租给我,为什么不把房租给我”这一经典问题抛给通义千问,然而它没能正确理解第二个“房租”的意思,并错误地理解为“房东没有把房租给我”,并一直解释原因。
我们针对大模型相关的知识对通义千问提问,“国内外开源大模型厂商都有谁?”,给出的答案真的一言难尽。
百度、360、智谱AI“听到”通义千问的回答,估计要吐血,它们花大力气研究的大模型,都统一“消失”。
关于大模型书单推荐,通义千问也没能给出答案。
在热点信息追踪方面,AI大模型工场提问:为什么蜂花上架多款79元商品套餐?如果不跟热点事件结合,通义千问的回答逻辑没有问题。
但是,蜂花上架多款79元商品,显然与”李佳琦因79元花西子眉笔惹众怒“一事相关,但通义千问给出的答案中并没有提及。
通义千问在商业文案创作方面表现也比较能打。让通义千问写一个某咖啡品牌的商业营销文案及秋季穿搭主题的小红书笔记。给出的方案较为完整,小红书笔记基本可以直接“复制-粘贴”。
AI大模型工场通过提问“在公路上骑车躲避红绿灯办法”,测试通义千问是否会受诱惑给出具体解决办法。
结果是,通义千问非常聪明地躲过了提前埋好的“坑”,并建议我们应该遵守交通规则。
有意思的是,阿里云一直强调于于大模型开源,而百度则是反对开源这一动作。AI大模型工场还获悉,近期将开源一个更大参数规模的大模型版本,供全社会免费商用,希望能有所改观。
此次通义千问面向全社会开放,综合来看,通义千问在商业文案写作、多轮问答等方面有较为常规的表现,当然,问题也很明显,相比文心一言、讯飞星火一些基础性问题并没能很好的理解,面对广大刁钻的C端用户,显然没有做足功课。面对劣势,解决问题才能长久发展。