DataFi：Web3领域AI数据经济的新蓝海

2025-08-01 05:15:06

摘要生成中

数据即资产：DataFi正在开启新蓝海

本月AI圈最大的话题莫过于Meta大举招募人才，组建了一支以华人科研人员为主的豪华AI团队。领队是年仅28岁、创建了Scale AI的Alexander Wang。Scale AI目前估值290亿美元，为包括美国军方、OpenAI、Anthropic、Meta等在内的多家AI巨头提供数据服务，其核心业务是提供大量准确的标注数据。

Scale AI之所以能在众多独角兽中脱颖而出，是因为它早早洞察到了数据在AI产业中的关键地位。算力、模型和数据是AI模型的三大支柱。如果将大模型比作一个人，那么模型是身体、算力是食物，而数据则是知识和信息。

在大语言模型快速发展的过程中，业界的重点经历了从模型到算力的转移。如今，大多数模型都采用transformer作为基本框架，偶尔会有MoE或MoRe等创新；各大公司要么自建超级计算集群，要么与云服务商签订长期协议解决算力问题。在这个基础上，数据的重要性日益凸显。

Scale AI专注于为AI模型打造坚实的数据基础，其业务不仅包括对现有数据的挖掘，还涉及数据生成业务。公司还组建了由不同领域专家组成的AI训练团队，为AI模型提供高质量的训练数据。

模型训练分为预训练和微调两个阶段。预训练类似于婴儿学习说话的过程，需要大量从网上爬取的文本、代码等信息。微调则类似于学校教育，有明确的目标和方向，通过精心设计的数据集培养模型特定能力。

因此，AI数据赛道主要包括两类数据集：一类是无需太多处理的大量数据，通常来自Reddit、Twitter、Github等UGC平台、公开文献数据库或企业私有数据库；另一类则需要精细设计和筛选，确保能培养模型特定能力，需要进行数据清洗、筛选、标注和人工反馈等工作。

随着模型能力的进一步提升，各种更加精细、专业的训练数据将成为决定模型能力的关键因素。从长远来看，AI数据也是一个具有滚雪球效应的长期主义赛道，随着前期工作的积累，数据资产将具备复利能力，价值不断增加。

Web3 DataFi：天选AI数据沃土

相比某公司在多个国家组建的几十万人远程人工标记团队，Web3在AI数据领域具有天然优势，由此诞生了DataFi这一新概念。理想情况下，Web3 DataFi的优势包括：

智能合约保障的数据主权、安全和隐私
天然的地理套利优势：自由的分布式架构，吸引最适合的劳动力
区块链明确的激励和结算优势
有利于构建更加高效、开放的"一条龙"数据市场

对于普通用户而言，DataFi也是最容易参与的去中心化AI项目。用户只需通过简单的操作就可以参与其中，包括提供数据、对模型进行评估、利用AI工具进行简单创作或参与数据交易等。

Web3 DataFi的潜力项目

目前，多个DataFi项目已获得可观融资。以下是一些代表性项目：

Sahara AI：致力于打造去中心化AI的超级基础设施和交易市场。
Yupp：AI模型反馈平台，收集用户对模型输出的反馈。
Vana：将用户个人数据转化为可货币化的数字资产。
Chainbase：专注于链上数据，覆盖200多条区块链。
Sapien：旨在将人类知识大规模转化为高质量AI训练数据。
Prisma X：致力于成为机器人的开放协调层。
Masa：Bittensor生态的头部子网项目之一。
Irys：专注于可编程数据存储和计算。
ORO：赋能普通人参与AI贡献。
Gata：定位为去中心化数据层。

这些项目目前壁垒普遍不高，但一旦积累了用户和生态粘性，平台优势会迅速累积。因此，早期项目应在激励措施和用户体验上重点发力。同时，这些平台还需要考虑如何管理参与者、保障数据质量，避免出现"劣币驱逐良币"的情况。

此外，提高透明度也是当前链上项目面临的一大挑战。许多项目仍缺乏足够的公开、可追踪的数据，这对Web3 DataFi的长期健康发展不利。

DataFi的大规模应用路径可分为两部分：一是吸引足够多的个人用户参与，形成数据采集/生成的生力军和AI经济的消费者；二是获得主流企业的认可，因为短期内它们是数据大单的主要来源。

DataFi代表着人类智能长期培育机器智能，同时通过智能合约保障人类劳动的收益，最终实现机器智能对人类的反哺。对于那些对AI时代感到不确定，或仍怀有区块链理想的人来说，参与DataFi可能是一个顺势而为的选择。

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

26人点赞了这条动态

赞赏
26
9
转发
分享

0/400

空投碎梦师

· 08-03 12:37

数据挖矿玩不过这华人小孩吧

狗狗币单身汉

· 08-02 16:57

又一个Saas割韭菜的最烦这些了

NFT悔改者

· 08-02 13:58

ai还真卷上数据了哈又一轮割韭菜

白嫖小能手

· 08-01 05:45

又是割韭菜的好项目嘿嘿

独孤验证者

· 08-01 05:42

真有钱啊 28岁就290亿了

quiet_lurker

· 08-01 05:40

标数据就值290亿？这钱也太好赚了

NotSatoshi

· 08-01 05:22

要是有人家一半醒目就好咯~