Vào ngày 6 tháng 3, một sản phẩm AI Agent đa năng toàn cầu mang tên Manus đã thu hút sự chú ý rộng rãi trong ngành. Sản phẩm do một công ty khởi nghiệp Trung Quốc phát triển ngay khi ra mắt đã nhận được sự ưa chuộng, mã mời khó có thể tìm được. Manus, với tư cách là AI Agent đa năng, có khả năng hoàn thành độc lập toàn bộ quy trình từ lập kế hoạch đến thực hiện, như viết báo cáo, tạo bảng tính, v.v. Nó không chỉ có thể tạo ra ý tưởng, mà còn có khả năng tư duy độc lập và hành động, thể hiện tính đa dạng và khả năng thực hiện chưa từng có.
Sự bùng nổ của Manus không chỉ thu hút sự chú ý của ngành công nghiệp mà còn cung cấp cho các nhà phát triển AI Agent khác những nguồn cảm hứng quý giá trong thiết kế sản phẩm. Với sự phát triển nhanh chóng của công nghệ AI, AI Agent như một nhánh quan trọng của trí tuệ nhân tạo, đang từng bước chuyển từ khái niệm sang ứng dụng thực tế, thể hiện tiềm năng to lớn trong nhiều lĩnh vực, ngành công nghiệp Web3 tự nhiên cũng không phải là ngoại lệ.
Tóm tắt AI Agent
AI Agent, hay đại diện trí tuệ nhân tạo, là một chương trình máy tính có khả năng tự quyết định và thực hiện nhiệm vụ dựa trên môi trường, đầu vào và mục tiêu đã định. Các thành phần cốt lõi bao gồm: một mô hình ngôn ngữ lớn (LLM) làm "bộ não", chịu trách nhiệm xử lý thông tin, học tập, quyết định và thực hiện hành động; cơ chế quan sát và cảm nhận; quá trình suy luận và tư duy; khả năng thực hiện hành động; cũng như chức năng ghi nhớ và truy xuất.
Mô hình thiết kế của AI Agent chủ yếu có hai hướng phát triển: một hướng tập trung vào khả năng lập kế hoạch, bao gồm REWOO, Plan & Execute, LLM Compiler; hướng còn lại tập trung vào khả năng phản tư, bao gồm Basic Reflection, Reflexion, Self Discover, LATS. Trong đó, mô hình ReAct là mô hình thiết kế đầu tiên và cũng được áp dụng rộng rãi nhất, quy trình điển hình có thể được mô tả như sau: suy nghĩ (Thought)→ hành động (Action)→ quan sát (Observation).
Dựa vào số lượng tác nhân, AI Agent có thể được chia thành Single Agent và Multi Agent. Single Agent tập trung vào sự kết hợp giữa LLM và công cụ, trong khi Multi Agent gán cho các tác nhân khác nhau những vai trò khác nhau, hoàn thành các nhiệm vụ phức tạp thông qua sự hợp tác. Hiện tại, hầu hết các khung đều tập trung vào bối cảnh Single Agent.
Giới thiệu về giao thức MCP
Model Context Protocol (MCP) là giao thức mã nguồn mở được công ty công nghệ dữ liệu ra mắt vào tháng 11 năm 2024, nhằm giải quyết vấn đề kết nối và tương tác giữa LLM và các nguồn dữ liệu bên ngoài. MCP có thể được so sánh như "cổng USB" của LLM, hỗ trợ việc linh hoạt cắm thêm dữ liệu và công cụ bên ngoài.
MCP cung cấp ba khả năng để mở rộng LLM: Resources (mở rộng kiến thức), Tools (thực thi hàm, gọi hệ thống bên ngoài) và Prompts (mẫu từ khóa đã được viết sẵn). MCP sử dụng kiến trúc Client-Server, với truyền tải nền tảng sử dụng giao thức JSON-RPC. Bất kỳ ai cũng có thể phát triển và lưu trữ MCP Server, và có thể dừng dịch vụ bất cứ lúc nào.
Tình trạng AI Agent trong Web3
Sự nổi bật của AI Agent trong ngành Web3 đã giảm mạnh kể từ khi đạt đỉnh vào tháng 1 năm nay, tổng giá trị thị trường đã giảm hơn 90%. Hiện tại, các dự án có tiếng nói và giá trị thị trường lớn chủ yếu xoay quanh việc khám phá Web3 trên nền tảng AI Agent, các mô hình chính bao gồm:
Chế độ nền tảng phát sóng: đại diện bởi Virtuals Protocol, cho phép người dùng tạo, triển khai và biến AI Agent thành lợi nhuận.
Mô hình DAO: Đại diện là ElizaOS, sử dụng mô hình AI để mô phỏng quyết định đầu tư, kết hợp với ý kiến của các thành viên DAO để thực hiện đầu tư.
Mô hình công ty thương mại: đại diện là Swarms, cung cấp khung Multi Agent cấp doanh nghiệp.
Từ góc độ mô hình kinh tế, hiện tại chỉ có mô hình nền tảng phát hành có thể đạt được vòng khép kín kinh tế tự cung tự cấp. Tuy nhiên, mô hình này cũng đối mặt với thách thức, như hầu hết các AI Agent được phát hành về bản chất là Meme, thiếu sự hỗ trợ giá trị nội tại.
MCP trong lĩnh vực Web3 khám phá
Sự xuất hiện của MCP đã mang đến một hướng khám phá mới cho AI Agent trong Web3:
Triển khai MCP Server vào mạng blockchain, giải quyết vấn đề điểm đơn và có khả năng chống kiểm duyệt.
Cung cấp chức năng tương tác giữa MCP Server và blockchain, như thực hiện giao dịch DeFi và quản lý, giảm bớt rào cản về kỹ thuật.
Ngoài ra, còn có kế hoạch xây dựng mạng lưới khuyến khích người sáng tạo OpenMCP.Network dựa trên Ethereum. Kế hoạch này nhằm mục đích tự động hóa, minh bạch, tin cậy và kháng kiểm duyệt việc khuyến khích thông qua hợp đồng thông minh, sử dụng ví Ethereum, ZK và các công nghệ khác để thực hiện chữ ký, xác thực quyền hạn và bảo vệ quyền riêng tư trong quá trình vận hành.
Kết luận
Việc phát hành Manus đánh dấu một cột mốc quan trọng cho sản phẩm AI Agent tổng quát, thế giới Web3 cũng cần một sản phẩm cột mốc để phá vỡ những nghi ngờ bên ngoài về việc thiếu tính thực dụng của nó. Sự xuất hiện của MCP mang lại hướng khám phá mới cho AI Agent trong Web3, bao gồm triển khai trên mạng blockchain, thực hiện tương tác với blockchain, và xây dựng mạng lưới khuyến khích cho người sáng tạo.
Sự kết hợp giữa AI và Web3 là xu hướng không thể tránh khỏi, chúng ta cần giữ vững sự kiên nhẫn và niềm tin, tiếp tục khám phá những khả năng vô hạn trong lĩnh vực này.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Chương mới của AI Agent: Từ Manus đến MCP, khám phá đổi mới trong lĩnh vực Web3
AI Agent trong lĩnh vực Web3: từ Manus đến MCP
Vào ngày 6 tháng 3, một sản phẩm AI Agent đa năng toàn cầu mang tên Manus đã thu hút sự chú ý rộng rãi trong ngành. Sản phẩm do một công ty khởi nghiệp Trung Quốc phát triển ngay khi ra mắt đã nhận được sự ưa chuộng, mã mời khó có thể tìm được. Manus, với tư cách là AI Agent đa năng, có khả năng hoàn thành độc lập toàn bộ quy trình từ lập kế hoạch đến thực hiện, như viết báo cáo, tạo bảng tính, v.v. Nó không chỉ có thể tạo ra ý tưởng, mà còn có khả năng tư duy độc lập và hành động, thể hiện tính đa dạng và khả năng thực hiện chưa từng có.
Sự bùng nổ của Manus không chỉ thu hút sự chú ý của ngành công nghiệp mà còn cung cấp cho các nhà phát triển AI Agent khác những nguồn cảm hứng quý giá trong thiết kế sản phẩm. Với sự phát triển nhanh chóng của công nghệ AI, AI Agent như một nhánh quan trọng của trí tuệ nhân tạo, đang từng bước chuyển từ khái niệm sang ứng dụng thực tế, thể hiện tiềm năng to lớn trong nhiều lĩnh vực, ngành công nghiệp Web3 tự nhiên cũng không phải là ngoại lệ.
Tóm tắt AI Agent
AI Agent, hay đại diện trí tuệ nhân tạo, là một chương trình máy tính có khả năng tự quyết định và thực hiện nhiệm vụ dựa trên môi trường, đầu vào và mục tiêu đã định. Các thành phần cốt lõi bao gồm: một mô hình ngôn ngữ lớn (LLM) làm "bộ não", chịu trách nhiệm xử lý thông tin, học tập, quyết định và thực hiện hành động; cơ chế quan sát và cảm nhận; quá trình suy luận và tư duy; khả năng thực hiện hành động; cũng như chức năng ghi nhớ và truy xuất.
Mô hình thiết kế của AI Agent chủ yếu có hai hướng phát triển: một hướng tập trung vào khả năng lập kế hoạch, bao gồm REWOO, Plan & Execute, LLM Compiler; hướng còn lại tập trung vào khả năng phản tư, bao gồm Basic Reflection, Reflexion, Self Discover, LATS. Trong đó, mô hình ReAct là mô hình thiết kế đầu tiên và cũng được áp dụng rộng rãi nhất, quy trình điển hình có thể được mô tả như sau: suy nghĩ (Thought)→ hành động (Action)→ quan sát (Observation).
Dựa vào số lượng tác nhân, AI Agent có thể được chia thành Single Agent và Multi Agent. Single Agent tập trung vào sự kết hợp giữa LLM và công cụ, trong khi Multi Agent gán cho các tác nhân khác nhau những vai trò khác nhau, hoàn thành các nhiệm vụ phức tạp thông qua sự hợp tác. Hiện tại, hầu hết các khung đều tập trung vào bối cảnh Single Agent.
Giới thiệu về giao thức MCP
Model Context Protocol (MCP) là giao thức mã nguồn mở được công ty công nghệ dữ liệu ra mắt vào tháng 11 năm 2024, nhằm giải quyết vấn đề kết nối và tương tác giữa LLM và các nguồn dữ liệu bên ngoài. MCP có thể được so sánh như "cổng USB" của LLM, hỗ trợ việc linh hoạt cắm thêm dữ liệu và công cụ bên ngoài.
MCP cung cấp ba khả năng để mở rộng LLM: Resources (mở rộng kiến thức), Tools (thực thi hàm, gọi hệ thống bên ngoài) và Prompts (mẫu từ khóa đã được viết sẵn). MCP sử dụng kiến trúc Client-Server, với truyền tải nền tảng sử dụng giao thức JSON-RPC. Bất kỳ ai cũng có thể phát triển và lưu trữ MCP Server, và có thể dừng dịch vụ bất cứ lúc nào.
Tình trạng AI Agent trong Web3
Sự nổi bật của AI Agent trong ngành Web3 đã giảm mạnh kể từ khi đạt đỉnh vào tháng 1 năm nay, tổng giá trị thị trường đã giảm hơn 90%. Hiện tại, các dự án có tiếng nói và giá trị thị trường lớn chủ yếu xoay quanh việc khám phá Web3 trên nền tảng AI Agent, các mô hình chính bao gồm:
Từ góc độ mô hình kinh tế, hiện tại chỉ có mô hình nền tảng phát hành có thể đạt được vòng khép kín kinh tế tự cung tự cấp. Tuy nhiên, mô hình này cũng đối mặt với thách thức, như hầu hết các AI Agent được phát hành về bản chất là Meme, thiếu sự hỗ trợ giá trị nội tại.
MCP trong lĩnh vực Web3 khám phá
Sự xuất hiện của MCP đã mang đến một hướng khám phá mới cho AI Agent trong Web3:
Ngoài ra, còn có kế hoạch xây dựng mạng lưới khuyến khích người sáng tạo OpenMCP.Network dựa trên Ethereum. Kế hoạch này nhằm mục đích tự động hóa, minh bạch, tin cậy và kháng kiểm duyệt việc khuyến khích thông qua hợp đồng thông minh, sử dụng ví Ethereum, ZK và các công nghệ khác để thực hiện chữ ký, xác thực quyền hạn và bảo vệ quyền riêng tư trong quá trình vận hành.
Kết luận
Việc phát hành Manus đánh dấu một cột mốc quan trọng cho sản phẩm AI Agent tổng quát, thế giới Web3 cũng cần một sản phẩm cột mốc để phá vỡ những nghi ngờ bên ngoài về việc thiếu tính thực dụng của nó. Sự xuất hiện của MCP mang lại hướng khám phá mới cho AI Agent trong Web3, bao gồm triển khai trên mạng blockchain, thực hiện tương tác với blockchain, và xây dựng mạng lưới khuyến khích cho người sáng tạo.
Sự kết hợp giữa AI và Web3 là xu hướng không thể tránh khỏi, chúng ta cần giữ vững sự kiên nhẫn và niềm tin, tiếp tục khám phá những khả năng vô hạn trong lĩnh vực này.