Giá trị gán nhãn dữ liệu AI tăng vọt, liệu mô hình Web3 có thể lật đổ cấu trúc truyền thống?

Ghi nhãn dữ liệu trở thành tâm điểm mới trong lĩnh vực AI, Web3 có thể lật đổ mô hình truyền thống

Gần đây, thông tin về việc các ông lớn công nghệ chi hàng tỷ đô la để mua lại các công ty gán nhãn dữ liệu đã thu hút sự chú ý rộng rãi trong ngành. Một ông lớn mạng xã hội đã mua gần một nửa cổ phần của Scale AI với giá 14,8 tỷ đô la, thương vụ mua lại với giá trên trời này đã khiến cả Thung lũng Silicon phải choáng váng, đồng thời định nghĩa lại giá trị của việc gán nhãn dữ liệu trong chuỗi ngành công nghiệp AI. Trong khi đó, một số dự án Web3 AI vẫn đang nỗ lực để vượt qua ấn tượng cố hữu, tìm kiếm sự công nhận từ thị trường. Sự tương phản rõ rệt này phản ánh xu hướng ngành như thế nào?

Đầu tiên, việc gán nhãn dữ liệu đang dần trở thành một lĩnh vực có giá trị hơn so với việc tập hợp sức mạnh tính toán phi tập trung. Mặc dù câu chuyện về việc sử dụng GPU nhàn rỗi để thách thức các ông lớn trong ngành điện toán đám mây rất hấp dẫn, nhưng sức mạnh tính toán về bản chất là một hàng hóa tiêu chuẩn, sự khác biệt chủ yếu nằm ở giá cả và khả năng tiếp cận. Lợi thế về giá có vẻ có thể tìm thấy chỗ đứng trong sự độc quyền của các ông lớn, nhưng do bị hạn chế bởi phân bố địa lý, độ trễ mạng và các yếu tố khuyến khích người dùng, một khi các ông lớn hạ giá hoặc tăng cung, lợi thế này rất dễ bị xóa nhòa.

So với, việc gán nhãn dữ liệu là một lĩnh vực cần trí tuệ con người và phán đoán chuyên môn. Mỗi gán nhãn chất lượng cao đều chứa đựng kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, không thể sao chép đơn giản như sức mạnh tính toán của GPU. Ví dụ, một gán nhãn chẩn đoán hình ảnh ung thư chính xác cần có trực giác chuyên môn của bác sĩ ung thư dày dạn kinh nghiệm, một phân tích tâm lý thị trường tài chính chính xác không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch dày dạn. Sự khan hiếm và tính không thể thay thế tự nhiên này đã mang lại cho gán nhãn dữ liệu một sự sâu sắc về lợi thế cạnh tranh vượt xa sức mạnh tính toán.

Một ông lớn truyền thông xã hội gần đây đã công bố việc mua lại 49% cổ phần của công ty đánh dấu dữ liệu Scale AI với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI trong năm nay. Điều đáng chú ý hơn là người sáng lập và CEO của Scale AI sẽ đồng thời đảm nhiệm chức vụ trưởng phòng thí nghiệm nghiên cứu "Siêu trí tuệ" mới được thành lập của công ty.

Doanh nhân gốc Hoa 25 tuổi này đã thành lập Scale AI vào năm 2016 khi còn là sinh viên bỏ học tại Đại học Stanford, hiện nay công ty mà anh quản lý đã đạt giá trị 30 tỷ USD. Danh sách khách hàng của Scale AI được coi là "đội hình toàn sao" trong lĩnh vực AI: nhiều công ty công nghệ nổi tiếng và các cơ quan chính phủ đều là đối tác lâu dài của họ. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo mô hình AI, với hơn 300.000 nhân viên gán nhãn được đào tạo chuyên nghiệp.

Khi mà công chúng vẫn đang tranh cãi về hiệu suất mô hình của nhà nào tốt hơn, những người chơi thực sự trong ngành đã âm thầm chuyển trận địa sang nguồn dữ liệu. Một cuộc "chiến tranh ngầm" về quyền kiểm soát tương lai của AI đã bắt đầu.

Sự thành công của Scale AI đã tiết lộ một sự thật bị bỏ qua: trong bối cảnh sức mạnh tính toán không còn khan hiếm và kiến trúc mô hình đang trở nên đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được "huấn luyện" kỹ lưỡng. Một gã khổng lồ truyền thông xã hội đã chi một khoản tiền khổng lồ không chỉ để mua một công ty gia công, mà còn để sở hữu "quyền khai thác dầu" của thời đại AI.

Tuy nhiên, sự độc quyền luôn gây ra sự phản kháng. Giống như nền tảng tổng hợp sức mạnh điện toán đám mây đang cố gắng lật đổ dịch vụ điện toán đám mây tập trung, một số dự án Web3 AI đang cố gắng tái cấu trúc quy tắc phân phối giá trị của việc gán nhãn dữ liệu bằng công nghệ blockchain. Điểm yếu chết người của mô hình gán nhãn dữ liệu truyền thống không phải là vấn đề kỹ thuật, mà là vấn đề thiết kế động lực.

Lấy ví dụ trong lĩnh vực y tế, một bác sĩ có thể mất hàng giờ để gán nhãn hình ảnh y tế, nhưng chỉ nhận được vài chục đô la tiền công. Trong khi đó, giá trị của mô hình AI được đào tạo từ những dữ liệu này có thể lên tới hàng tỷ đô la, nhưng bác sĩ lại không thể chia sẻ phần lợi nhuận trong đó. Sự phân bổ giá trị cực kỳ bất công này đã ảnh hưởng nghiêm trọng đến thiện chí cung cấp dữ liệu chất lượng cao.

Cơ chế khuyến khích token của Web3 cung cấp một hướng đi mới để giải quyết vấn đề này. Trong mô hình này, những người gán nhãn dữ liệu không còn là những "công nhân nông nghiệp dữ liệu" giá rẻ, mà là những "cổ đông" thực sự của mạng lưới mô hình ngôn ngữ AI lớn. Rõ ràng, lợi thế của Web3 trong việc cải cách quan hệ sản xuất thể hiện rõ nét hơn trong bối cảnh gán nhãn dữ liệu.

Thú vị thay, một dự án Web3 AI đã đúng lúc thông báo sẽ tiến hành phát hành token ngay khi sự kiện mua lại lớn này diễn ra. Đây là sự trùng hợp hay một kế hoạch được chuẩn bị kỹ lưỡng? Theo quan điểm của tác giả, điều này thực sự phản ánh một bước ngoặt của thị trường: bất kể là Web3 AI hay AI truyền thống, cả hai đã chuyển từ "cạnh tranh sức mạnh tính toán" sang một giai đoạn mới mang tên "cạnh tranh chất lượng dữ liệu".

Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng tiền, Web3 đang xây dựng một thí nghiệm "dân chủ hóa dữ liệu" quy mô lớn hơn bằng kinh tế token. Cuộc chơi về tương lai của AI chỉ mới bắt đầu.

Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Phần thưởng
  • 5
  • Chia sẻ
Bình luận
0/400
NFTArtisanHQvip
· 07-04 17:39
Mô hình đáng khám phá
Xem bản gốcTrả lời0
AllInDaddyvip
· 07-03 22:35
Đánh dấu làm giàu không phải là mơ
Xem bản gốcTrả lời0
NftPhilanthropistvip
· 07-02 02:39
bằng chứng hoặc huyền thoại
Xem bản gốcTrả lời0
MEVHunterXvip
· 07-02 02:39
Khả năng tính toán không bằng dữ liệu giá trị
Xem bản gốcTrả lời0
MainnetDelayedAgainvip
· 07-02 02:35
bullish dữ liệu đánh dấu vùng
Xem bản gốcTrả lời0
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)