微软开源创新框架:可将DeepSeek,变成AI Agent

jin10
DEEPSEEK-4.55%
AGENT7.6%

金十数据2月17日讯,微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AI Agent。与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。在高分辨率Agent基准测试ScreenSpot Pro中,V2+GPT-4o的准确率达到了惊人的39.6%,而GPT-4o原始准确率只有0.8%,整体提升非常大。除了V2,微软还开源了omnitool,这是一个基于Docker的 Windows 系统,涵盖屏幕理解、定位、动作规划和执行等功能,也是将大模型变成Agent的关键工具。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
GateUser-d6ca73f1vip
· 2025-02-23 07:30
能上现货区么
回复0
GateUser-50c1e0ddvip
· 2025-02-17 03:19
牛市 🐂
查看原文回复0
GateUser-50c1e0ddvip
· 2025-02-17 02:39
牛市 🐂
查看原文回复0
Mmhreyan8513vip
· 2025-02-17 00:26
猿类入场 🚀牛市 🐂HODL 紧 💪1000倍的感觉 🤑1000倍的感觉 🤑HODL 紧 💪牛市 🐂猿类入场 🚀
查看原文回复0