Дані Jinshuju, 17 лютого, Microsoft опублікувала на своєму веб-сайті оновлену версію фреймворку OmniParser для візуальних агентів V2.0, яка може перетворити моделі, такі як DeepSeek-R1, GPT-4o, Qwen-2.5VL, в штучних інтелектів, які можуть використовуватися на комп'ютері. Порівняно з версією V1, V2 має більш високу точність при виявленні менших взаємодійних елементів користувальницького інтерфейсу та швидкість мислення, що збільшилася на 60%. У тесті ScreenSpot Pro на високій роздільній здатності для агента Бенчмарк, точність V2+GPT-4o досягла дивовижних 39,6%, у той час як початкова точність GPT-4o становить лише 0,8%, що є значним покращенням в цілому. Окрім V2, Microsoft також відкрила вихідний код omnitool, який є ключовим інструментом для перетворення великих моделей у агентів, який заснований на Docker для операційної системи Windows і включає функції розуміння екрана, локалізації, планування та виконання дій.
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
2 лайків
Нагородити
2
4
Поділіться
Прокоментувати
0/400
GateUser-d6ca73f1
· 02-23 07:30
Чи можна ввійти на ринок спот?
відповісти на0
GateUser-50c1e0dd
· 02-17 03:19
булран 🐂
відповісти на0
GateUser-50c1e0dd
· 02-17 02:39
булран 🐂
відповісти на0
Mmhreyan8513
· 02-17 00:26
APE In 🚀булран 🐂HODL Тісно 💪1000x Вібрації 🤑1000x Вібрації 🤑HODL Тісно 💪булран 🐂APE In 🚀
Мікрософт Відкритий вихідний код інноваційний фреймворк: можна перетворити DeepSeek у AI Agent
Дані Jinshuju, 17 лютого, Microsoft опублікувала на своєму веб-сайті оновлену версію фреймворку OmniParser для візуальних агентів V2.0, яка може перетворити моделі, такі як DeepSeek-R1, GPT-4o, Qwen-2.5VL, в штучних інтелектів, які можуть використовуватися на комп'ютері. Порівняно з версією V1, V2 має більш високу точність при виявленні менших взаємодійних елементів користувальницького інтерфейсу та швидкість мислення, що збільшилася на 60%. У тесті ScreenSpot Pro на високій роздільній здатності для агента Бенчмарк, точність V2+GPT-4o досягла дивовижних 39,6%, у той час як початкова точність GPT-4o становить лише 0,8%, що є значним покращенням в цілому. Окрім V2, Microsoft також відкрила вихідний код omnitool, який є ключовим інструментом для перетворення великих моделей у агентів, який заснований на Docker для операційної системи Windows і включає функції розуміння екрана, локалізації, планування та виконання дій.