DataFi: Web3 thúc đẩy xu hướng mới về tài sản dữ liệu AI

robot
Đang tạo bản tóm tắt

Dữ liệu là tài sản: DataFi mở ra biển xanh mới

Thế giới đang ở trong thời kỳ cạnh tranh để xây dựng mô hình cơ bản tốt nhất. Mặc dù khả năng tính toán và kiến trúc mô hình rất quan trọng, nhưng thực sự điều tạo ra lợi thế cạnh tranh chính là dữ liệu huấn luyện. Tin tức lớn nhất trong lĩnh vực AI tháng này là Meta thể hiện sức mạnh, Zuckerberg tích cực tuyển dụng nhân tài, đã thành lập một đội ngũ AI hùng hậu chủ yếu là nhân tài nghiên cứu người Hoa. Người dẫn đầu là Alexander Wang, 28 tuổi, người sáng lập Scale AI hiện có giá trị 29 tỷ USD, cung cấp dịch vụ dữ liệu cho nhiều gã khổng lồ AI có tính cạnh tranh như quân đội Mỹ, OpenAI, Anthropic, Meta. Doanh nghiệp cốt lõi của Scale AI là cung cấp một lượng lớn dữ liệu được gán nhãn chính xác.

Con đường thành công của Scale AI

Lý do khiến Scale AI nổi bật giữa nhiều kỳ lân là vì họ đã sớm nhận ra tầm quan trọng của dữ liệu trong ngành công nghiệp AI.

Năng lực tính toán, mô hình, và dữ liệu là ba trụ cột chính của mô hình AI. Nếu coi mô hình lớn như một con người, thì mô hình là cơ thể, năng lực tính toán là thực phẩm, còn dữ liệu là tri thức/thông tin.

Trong quá trình phát triển nhanh chóng của LLM, trọng tâm của ngành đã trải qua sự chuyển đổi từ mô hình sang sức mạnh tính toán. Hiện tại, hầu hết các mô hình đã xác định transformer làm khung, thỉnh thoảng có những đổi mới như MoE hoặc MoRe; các ông lớn chủ yếu tự xây dựng cụm siêu máy tính hoặc ký hợp đồng dài hạn với các nhà cung cấp dịch vụ đám mây để giải quyết vấn đề sức mạnh tính toán. Sau khi đáp ứng được nhu cầu cơ bản về sức mạnh tính toán, tầm quan trọng của dữ liệu dần dần được làm nổi bật.

Scale AI cam kết xây dựng nền tảng dữ liệu vững chắc cho các mô hình AI, công việc của họ không chỉ bao gồm việc khai thác dữ liệu hiện có mà còn tập trung vào các hoạt động tạo dữ liệu lâu dài. Công ty thành lập đội ngũ huấn luyện AI gồm các chuyên gia từ nhiều lĩnh vực khác nhau, nhằm cung cấp dữ liệu chất lượng cao hơn cho việc đào tạo các mô hình AI.

Dữ liệu là tài sản: DataFi đang mở ra biển xanh mới

Hai giai đoạn huấn luyện mô hình

Huấn luyện mô hình được chia thành hai phần: tiền huấn luyện và tinh chỉnh.

Quá trình tiền huấn luyện giống như cách mà trẻ em học nói, cần phải cung cấp cho mô hình AI một lượng lớn văn bản, mã và thông tin khác được thu thập từ internet, để mô hình có thể tự học và nắm vững khả năng giao tiếp cơ bản.

Việc tinh chỉnh thì giống như đi học, thường có đúng sai, câu trả lời và phương hướng rõ ràng. Các "trường" khác nhau sẽ nuôi dưỡng ra những "nhân tài" có những đặc điểm khác nhau. Chúng tôi thông qua một số tập dữ liệu được chuẩn bị kỹ lưỡng và có mục tiêu, giúp mô hình có được khả năng mà chúng tôi mong muốn.

Vì vậy, chúng ta cần hai loại dữ liệu:

  1. Dữ liệu khổng lồ không cần xử lý nhiều, chủ yếu đến từ dữ liệu thu thập từ các nền tảng UGC lớn, cơ sở dữ liệu tài liệu công khai, cơ sở dữ liệu riêng của doanh nghiệp, v.v.

  2. Bộ dữ liệu chuyên nghiệp được thiết kế và chọn lọc cẩn thận, cần phải thực hiện các công việc như làm sạch dữ liệu, chọn lọc, gán nhãn, phản hồi từ con người, v.v.

Hai loại tập dữ liệu này tạo thành chủ thể của lĩnh vực AI Data. Hiện nay, người ta thường cho rằng, khi lợi thế về sức mạnh tính toán dần biến mất, dữ liệu sẽ trở thành yếu tố then chốt giúp các nhà sản xuất mô hình lớn duy trì sức cạnh tranh.

Với sự nâng cao khả năng của mô hình, các dữ liệu huấn luyện tinh vi và chuyên nghiệp hơn sẽ trở thành yếu tố quyết định khả năng của mô hình. Nếu so sánh việc huấn luyện mô hình với việc đào tạo một cao thủ võ lâm, thì bộ dữ liệu chất lượng cao chính là bí kíp võ công thượng thừa.

Về lâu dài, AI Data là một lĩnh vực dài hạn có hiệu ứng quả cầu tuyết. Khi công việc ban đầu được tích lũy, tài sản dữ liệu sẽ có khả năng sinh lãi kép, giá trị sẽ tăng lên theo thời gian.

Dữ liệu là tài sản: DataFi đang mở ra một đại dương xanh mới

Web3 DataFi: Môi trường lý tưởng cho Dữ liệu AI

So với các công ty dữ liệu truyền thống, Web3 có lợi thế tự nhiên trong lĩnh vực dữ liệu AI, từ đó khái niệm DataFi ra đời.

Trong lý tưởng, lợi thế của Web3 DataFi bao gồm:

  1. Hợp đồng thông minh đảm bảo quyền sở hữu dữ liệu, an toàn và quyền riêng tư
  2. Kiến trúc phân tán thu hút lực lượng lao động toàn cầu phù hợp nhất
  3. Blockchain cung cấp các lợi ích rõ ràng về khuyến khích và thanh toán
  4. Hữu ích cho việc xây dựng một thị trường dữ liệu một cửa hiệu quả và mở.

Đối với người dùng thông thường, DataFi là dự án AI phi tập trung dễ tham gia nhất. Người dùng chỉ cần đăng nhập ví một cách đơn giản, có thể tham gia bằng cách hoàn thành nhiều nhiệm vụ khác nhau, như cung cấp dữ liệu, đánh giá mô hình, sử dụng công cụ AI để sáng tạo đơn giản, tham gia giao dịch dữ liệu, v.v.

Tiềm năng dự án DataFi Web3

Hiện nay đã có nhiều dự án DataFi nhận được khoản tài trợ lớn, dưới đây là một số dự án tiêu biểu:

  • Sahara AI: Cam kết xây dựng cơ sở hạ tầng và thị trường giao dịch cho AI phi tập trung
  • Yupp: Nền tảng phản hồi mô hình AI, thu thập đánh giá của người dùng về đầu ra của mô hình
  • Vana: Chuyển đổi dữ liệu cá nhân của người dùng thành tài sản số có thể thương mại hóa
  • Chainbase: Tập trung vào dữ liệu trên chuỗi, bao phủ hơn 200 blockchain.
  • Sapien: Biến kiến thức nhân loại thành dữ liệu huấn luyện AI chất lượng cao
  • Prisma X: Cam kết xây dựng lớp phối hợp mở cho robot
  • Masa: Dự án subnet của hệ sinh thái Bittensor, cung cấp truy cập dữ liệu thời gian thực
  • Irys: Tập trung vào lưu trữ dữ liệu có thể lập trình và tính toán
  • ORO: Trao quyền cho người bình thường tham gia đóng góp AI
  • Gata: Lớp dữ liệu phi tập trung, cung cấp nhiều cách tham gia dữ liệu.

Các dự án này hiện tại có rào cản không cao, nhưng khi người dùng và sự gắn kết của hệ sinh thái gia tăng, lợi thế của nền tảng sẽ nhanh chóng hình thành. Các dự án giai đoạn đầu nên tập trung vào các biện pháp khuyến khích và trải nghiệm người dùng để thu hút đủ người dùng.

Đồng thời, những nền tảng này cũng cần chú ý đến cách quản lý nhân lực, đảm bảo chất lượng dữ liệu, tránh hiện tượng "lừa đảo" dẫn đến sự đào thải của những đồng tiền tốt. Một số dự án như Sahara, Sapien đã bắt đầu nhấn mạnh chất lượng dữ liệu, nỗ lực thiết lập mối quan hệ hợp tác lâu dài và lành mạnh với người dùng của nền tảng.

Ngoài ra, việc nâng cao tính minh bạch cũng là một thách thức mà các dự án trên chuỗi hiện nay phải đối mặt. Nhiều dự án vẫn cần phải tăng tốc độ mở cửa và minh bạch để thúc đẩy sự phát triển lâu dài và khỏe mạnh của Web3 DataFi.

Việc áp dụng DataFi quy mô lớn cần được thúc đẩy từ hai hướng: một là thu hút đủ nhiều người dùng cá nhân tham gia vào việc thu thập / tạo ra dữ liệu, hình thành nhóm người tiêu dùng cho nền kinh tế AI; hai là nhận được sự công nhận từ các doanh nghiệp chính thống, vì trong thời gian ngắn chúng là nguồn cung cấp dữ liệu lớn chủ yếu.

Dữ liệu là tài sản: DataFi đang mở ra đại dương xanh mới

Kết luận

Từ một góc độ nào đó, DataFi là việc sử dụng trí tuệ con người để nuôi dưỡng trí tuệ máy móc trong thời gian dài, đồng thời thông qua hợp đồng thông minh để đảm bảo lợi ích từ lao động trí tuệ con người, cuối cùng tận hưởng sự đáp lại từ trí tuệ máy móc.

Đối với những người còn nhiều sự không chắc chắn về thời đại AI, hoặc vẫn còn lý tưởng trong lĩnh vực blockchain, việc theo bước các ông lớn trong ngành để tham gia vào DataFi là một lựa chọn hợp thời.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 4
  • Chia sẻ
Bình luận
0/400
SneakyFlashloanvip
· 20giờ trước
Trời ơi, 28 tuổi đã 290 tỷ, tôi phải cố gắng hơn rồi.
Xem bản gốcTrả lời0
MetaMuskRatvip
· 20giờ trước
Lại là Zach gây chuyện, cười chết mất.
Xem bản gốcTrả lời0
NftDataDetectivevip
· 20giờ trước
có vẻ như zuck cuối cùng cũng hiểu ra... dữ liệu là dầu mới fr fr
Xem bản gốcTrả lời0
AirdropChaservip
· 20giờ trước
Ngồi chờ xem, dự án thật sự có tiền, đã đến lúc đầu tư.
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)