📢 Gate广场独家活动: #PUBLIC创作大赛# 正式开启!
参与 Gate Launchpool 第 297 期 — PublicAI (PUBLIC),并在 Gate广场发布你的原创内容,即有机会瓜分 4,000 枚 $PUBLIC 奖励池!
🎨 活动时间
2025年8月18日 10:00 – 2025年8月22日 16:00 (UTC)
📌 参与方式
在 Gate广场发布与 PublicAI (PUBLIC) 或当前 Launchpool 活动相关的原创内容
内容需不少于 100 字(可为分析、教程、创意图文、测评等)
添加话题: #PUBLIC创作大赛#
帖子需附带 Launchpool 参与截图(如质押记录、领取页面等)
🏆 奖励设置(总计 4,000 枚 $PUBLIC)
🥇 一等奖(1名):1,500 $PUBLIC
🥈 二等奖(3名):每人 500 $PUBLIC
🥉 三等奖(5名):每人 200 $PUBLIC
📋 评选标准
内容质量(相关性、清晰度、创意性)
互动热度(点赞、评论)
含有 Launchpool 参与截图的帖子将优先考虑
📄 注意事项
所有内容须为原创,严禁抄袭或虚假互动
获奖用户需完成 Gate广场实名认证
Gate 保留本次活动的最终解释权
DataFi:Web3领域AI数据经济的新蓝海
数据即资产:DataFi正在开启新蓝海
本月AI圈最大的话题莫过于Meta大举招募人才,组建了一支以华人科研人员为主的豪华AI团队。领队是年仅28岁、创建了Scale AI的Alexander Wang。Scale AI目前估值290亿美元,为包括美国军方、OpenAI、Anthropic、Meta等在内的多家AI巨头提供数据服务,其核心业务是提供大量准确的标注数据。
Scale AI之所以能在众多独角兽中脱颖而出,是因为它早早洞察到了数据在AI产业中的关键地位。算力、模型和数据是AI模型的三大支柱。如果将大模型比作一个人,那么模型是身体、算力是食物,而数据则是知识和信息。
在大语言模型快速发展的过程中,业界的重点经历了从模型到算力的转移。如今,大多数模型都采用transformer作为基本框架,偶尔会有MoE或MoRe等创新;各大公司要么自建超级计算集群,要么与云服务商签订长期协议解决算力问题。在这个基础上,数据的重要性日益凸显。
Scale AI专注于为AI模型打造坚实的数据基础,其业务不仅包括对现有数据的挖掘,还涉及数据生成业务。公司还组建了由不同领域专家组成的AI训练团队,为AI模型提供高质量的训练数据。
模型训练分为预训练和微调两个阶段。预训练类似于婴儿学习说话的过程,需要大量从网上爬取的文本、代码等信息。微调则类似于学校教育,有明确的目标和方向,通过精心设计的数据集培养模型特定能力。
因此,AI数据赛道主要包括两类数据集:一类是无需太多处理的大量数据,通常来自Reddit、Twitter、Github等UGC平台、公开文献数据库或企业私有数据库;另一类则需要精细设计和筛选,确保能培养模型特定能力,需要进行数据清洗、筛选、标注和人工反馈等工作。
随着模型能力的进一步提升,各种更加精细、专业的训练数据将成为决定模型能力的关键因素。从长远来看,AI数据也是一个具有滚雪球效应的长期主义赛道,随着前期工作的积累,数据资产将具备复利能力,价值不断增加。
Web3 DataFi:天选AI数据沃土
相比某公司在多个国家组建的几十万人远程人工标记团队,Web3在AI数据领域具有天然优势,由此诞生了DataFi这一新概念。理想情况下,Web3 DataFi的优势包括:
对于普通用户而言,DataFi也是最容易参与的去中心化AI项目。用户只需通过简单的操作就可以参与其中,包括提供数据、对模型进行评估、利用AI工具进行简单创作或参与数据交易等。
Web3 DataFi的潜力项目
目前,多个DataFi项目已获得可观融资。以下是一些代表性项目:
Sahara AI:致力于打造去中心化AI的超级基础设施和交易市场。
Yupp:AI模型反馈平台,收集用户对模型输出的反馈。
Vana:将用户个人数据转化为可货币化的数字资产。
Chainbase:专注于链上数据,覆盖200多条区块链。
Sapien:旨在将人类知识大规模转化为高质量AI训练数据。
Prisma X:致力于成为机器人的开放协调层。
Masa:Bittensor生态的头部子网项目之一。
Irys:专注于可编程数据存储和计算。
ORO:赋能普通人参与AI贡献。
Gata:定位为去中心化数据层。
这些项目目前壁垒普遍不高,但一旦积累了用户和生态粘性,平台优势会迅速累积。因此,早期项目应在激励措施和用户体验上重点发力。同时,这些平台还需要考虑如何管理参与者、保障数据质量,避免出现"劣币驱逐良币"的情况。
此外,提高透明度也是当前链上项目面临的一大挑战。许多项目仍缺乏足够的公开、可追踪的数据,这对Web3 DataFi的长期健康发展不利。
DataFi的大规模应用路径可分为两部分:一是吸引足够多的个人用户参与,形成数据采集/生成的生力军和AI经济的消费者;二是获得主流企业的认可,因为短期内它们是数据大单的主要来源。
DataFi代表着人类智能长期培育机器智能,同时通过智能合约保障人类劳动的收益,最终实现机器智能对人类的反哺。对于那些对AI时代感到不确定,或仍怀有区块链理想的人来说,参与DataFi可能是一个顺势而为的选择。