📢 Gate广场 #NERO发帖挑战# 秀观点赢大奖活动火热开启!
Gate NERO生态周来袭!发帖秀出NERO项目洞察和活动实用攻略,瓜分30,000NERO!
💰️ 15位优质发帖用户 * 2,000枚NERO每人
如何参与:
1️⃣ 调研NERO项目
对NERO的基本面、社区治理、发展目标、代币经济模型等方面进行研究,分享你对项目的深度研究。
2️⃣ 参与并分享真实体验
参与NERO生态周相关活动,并晒出你的参与截图、收益图或实用教程。可以是收益展示、简明易懂的新手攻略、小窍门,也可以是行情点位分析,内容详实优先。
3️⃣ 鼓励带新互动
如果你的帖子吸引到他人参与活动,或者有好友评论“已参与/已交易”,将大幅提升你的获奖概率!
NERO热门活动(帖文需附以下活动链接):
NERO Chain (NERO) 生态周:Gate 已上线 NERO 现货交易,为回馈平台用户,HODLer Airdrop、Launchpool、CandyDrop、余币宝已上线 NERO,邀您体验。参与攻略见公告:https://www.gate.com/announcements/article/46284
高质量帖子Tips:
教程越详细、图片越直观、互动量越高,获奖几率越大!
市场见解独到、真实参与经历、有带新互动者,评选将优先考虑。
帖子需原创,字数不少于250字,且需获得至少3条有效互动
DataFi:Web3推动AI数据资产化新趋势
数据即资产:DataFi 开启新蓝海
全球正处于竞相构建最佳基础模型的时代。虽然计算能力和模型架构很重要,但真正的护城河是训练数据。本月AI圈最大的新闻是Meta展现实力,扎克伯格广招人才,组建了一支以华人科研人才为主的豪华AI团队。领队是28岁的Alexander Wang,他创建的Scale AI目前估值290亿美金,为包括美国军方、OpenAI、Anthropic、Meta等在内的多家有竞争关系的AI巨头提供数据服务。Scale AI的核心业务是提供大量准确的标注数据。
Scale AI的成功之道
Scale AI之所以能在众多独角兽中脱颖而出,是因为它早早发现了数据在AI产业中的重要性。
算力、模型、数据是AI模型的三大支柱。如果将大模型比作一个人,那么模型是身体、算力是食物,而数据则是知识/信息。
在LLM快速发展的过程中,业界的重点经历了从模型到算力的转移。目前大多数模型都已确立了transformer作为框架,偶尔有MoE或MoRe等创新;各大巨头或自建超级计算集群,或与云服务商签订长期协议解决算力问题。在解决了算力的基本需求后,数据的重要性逐渐凸显。
Scale AI致力于为AI模型打造坚实的数据基础,其业务不仅包括对现有数据的挖掘,还着眼于长远的数据生成业务。该公司通过不同领域的人工专家组成AI训练团队,为AI模型的训练提供更优质的数据。
模型训练的两个阶段
模型训练分为预训练和微调两个部分。
预训练类似人类婴儿学习说话的过程,需要向AI模型输入大量从网上爬取的文本、代码等信息,让模型通过自学掌握基本的沟通能力。
微调则类似上学,通常有明确的对错、答案和方向。不同的"学校"会培养出不同特点的"人才"。我们通过一些精心准备的、有针对性的数据集,使模型具备我们期望的能力。
因此,我们需要两类数据:
无需太多处理的海量数据,主要来自大型UGC平台的爬虫数据、公开文献数据库、企业私有数据库等。
经过精心设计和筛选的专业数据集,需要进行数据清洗、筛选、标注、人工反馈等工作。
这两类数据集构成了AI Data赛道的主体。目前普遍认为,随着算力优势的逐渐消失,数据将成为大模型厂商保持竞争力的关键。
随着模型能力的进一步提升,各种更精细、专业的训练数据将成为决定模型能力的关键因素。如果将模型训练比作培养武林高手,那么优质的数据集就是最上乘的武功秘籍。
从长远来看,AI Data是一个具有滚雪球效应的长期赛道。随着前期工作的积累,数据资产将具备复利能力,价值会随时间增长。
Web3 DataFi:AI Data的理想土壤
相比传统数据公司,Web3在AI数据领域具有天然优势,由此诞生了DataFi概念。
理想情况下,Web3 DataFi的优势包括:
对普通用户而言,DataFi是最容易参与的去中心化AI项目。用户只需简单登录钱包,就可以通过完成各种任务参与其中,如提供数据、对模型进行评估、利用AI工具进行简单创作、参与数据交易等。
Web3 DataFi的潜力项目
目前已有多个DataFi项目获得大额融资,以下是部分代表性项目:
这些项目目前壁垒普遍不高,但随着用户和生态粘性的积累,平台优势将迅速形成。早期项目应该在激励措施和用户体验上着重发力,吸引足够的用户。
同时,这些平台也需要注意如何管理人工、保障数据质量,避免出现"撸毛党"导致的劣币驱逐良币现象。一些项目如Sahara、Sapien已开始强调数据质量,努力与平台用户建立长期健康的合作关系。
此外,提高透明度也是当前链上项目面临的一个挑战。许多项目仍需加快开放、透明的步伐,以促进Web3 DataFi的长期健康发展。
DataFi的大规模采用需要从两个方面推进:一是吸引足够多的个人用户参与数据采集/生成,形成AI经济的消费者群体;二是获得主流企业的认可,因为短期内它们是数据大单的主要来源。
结语
从某种角度看,DataFi是用人类智能长期培育机器智能,同时通过智能合约保障人类智能劳动的收益,最终享受机器智能的回馈。
对于那些对AI时代充满不确定性,或在区块链领域仍怀有理想的人来说,跟随资本大佬的脚步投身DataFi,不失为一个顺势而为的选择。