成长值第 1️⃣ 1️⃣ 期夏季抽奖大狂欢火热进行中!
立即抽奖,iPhone16 Pro Max和精美周边等你拿!
👉 https://www.gate.com/activities/pointprize?now_period=11
🎁 100%中奖,在动态完成发帖、点赞、评论、社群发言等成长值任务
抽取iPhone16 Pro Max 512G、Gate品牌卫衣、速干运动套装、人气代币、合约体验券等超多好礼!
集齐两片碎片轻松兑周边,福利抱回家!
截止于6月4日 24:00 UTC+8,快来试试手气!
更多: https://www.gate.com/announcements/article/45185
微软开源创新框架:可将DeepSeek,变成AI Agent
金十数据2月17日讯,微软在官网发布了视觉Agent解析框架OmniParser最新版本V2.0,可将DeepSeek-R1、GPT-4o、Qwen-2.5VL等模型,变成可在计算机使用的AI Agent。与V1版本相比,V2在检测较小的可交互UI元素时准确率更高、推理速度更快,延迟降低了60%。在高分辨率Agent基准测试ScreenSpot Pro中,V2+GPT-4o的准确率达到了惊人的39.6%,而GPT-4o原始准确率只有0.8%,整体提升非常大。除了V2,微软还开源了omnitool,这是一个基于Docker的 Windows 系统,涵盖屏幕理解、定位、动作规划和执行等功能,也是将大模型变成Agent的关键工具。