微软开源创新框架:可将DeepSeek,变成AI Agent

robot
摘要生成中

金十数据2月17日讯,微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AI Agent。与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。在高分辨率Agent基准测试ScreenSpot Pro中,V2+GPT-4o的准确率达到了惊人的39.6%,而GPT-4o原始准确率只有0.8%,整体提升非常大。除了V2,微软还开源了omnitool,这是一个基于Docker的 Windows 系统,涵盖屏幕理解、定位、动作规划和执行等功能,也是将大模型变成Agent的关键工具。

本页面内容仅供参考,非招揽或要约,也不提供投资、税务或法律咨询。详见声明了解更多风险披露。
  • 赞赏
  • 4
  • 分享
评论
0/400
GateUser-d6ca73f1vip
· 02-23 07:30
能上现货区么
回复0
GateUser-50c1e0ddvip
· 02-17 03:19
牛市 🐂
回复0
GateUser-50c1e0ddvip
· 02-17 02:39
牛市 🐂
回复0
Mmhreyan8513vip
· 02-17 00:26
猿类入场 🚀牛市 🐂HODL 紧 💪1000倍的感觉 🤑1000倍的感觉 🤑HODL 紧 💪牛市 🐂猿类入场 🚀
回复0
交易,随时随地
qrCode
扫码下载 Gate APP
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)