Данные Kin 2月17日, Майкрософт выпустила на своем официальном веб-сайте последнюю версию фреймворка OmniParser V2.0, который преобразует модели, такие как DeepSeek-R1, GPT-4o, Qwen-2.5VL в искусственный интеллект, который можно использовать на компьютере. По сравнению с версией V1, V2 имеет более высокую точность при обнаружении более мелких элементов пользовательского интерфейса, более быструю скорость рассуждения и 60% задержку. В тесте высокого разрешения ScreenSpot Pro для Agentов, точность V2+GPT-4o достигла удивительных 39.6%, в то время как исходная точность GPT-4o составляла всего 0.8%, что является значительным улучшением. Помимо V2, Майкрософт также Открытый исходный код omnitool, который представляет собой систему Windows на основе Docker, включающую в себя понимание экрана, позиционирование, планирование и выполнение действий, и является ключевым инструментом для преобразования больших моделей в Agentов.
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
2 Лайков
Награда
2
4
Поделиться
комментарий
0/400
GateUser-d6ca73f1
· 02-23 07:30
Можно попасть на рынок срочных поставок?
Ответить0
GateUser-50c1e0dd
· 02-17 03:19
Бычий рынок 🐂
Ответить0
GateUser-50c1e0dd
· 02-17 02:39
Бычий рынок 🐂
Ответить0
Mmhreyan8513
· 02-17 00:26
Ape In 🚀Бычий рынок 🐂HODL Тайт 💪1000x Вибрации 🤑1000x Вибрации 🤑HODL Тайт 💪Бычий рынок 🐂Ape In 🚀
Майкрософт Открытый исходный код инновационной платформы: можно превратить DeepSeek в AI Agent
Данные Kin 2月17日, Майкрософт выпустила на своем официальном веб-сайте последнюю версию фреймворка OmniParser V2.0, который преобразует модели, такие как DeepSeek-R1, GPT-4o, Qwen-2.5VL в искусственный интеллект, который можно использовать на компьютере. По сравнению с версией V1, V2 имеет более высокую точность при обнаружении более мелких элементов пользовательского интерфейса, более быструю скорость рассуждения и 60% задержку. В тесте высокого разрешения ScreenSpot Pro для Agentов, точность V2+GPT-4o достигла удивительных 39.6%, в то время как исходная точность GPT-4o составляла всего 0.8%, что является значительным улучшением. Помимо V2, Майкрософт также Открытый исходный код omnitool, который представляет собой систему Windows на основе Docker, включающую в себя понимание экрана, позиционирование, планирование и выполнение действий, и является ключевым инструментом для преобразования больших моделей в Agentов.