Développement collaboratif des technologies Web3 et de l'IA : déverrouiller de nouvelles opportunités de ressources de puissance de calcul et de valeur des données

IA+Web3 : Tours et places

TL;DR

  1. Les projets Web3 basés sur l'IA deviennent des cibles d'attraction de capitaux sur les marchés primaire et secondaire.

  2. Les opportunités de Web3 dans l'industrie de l'IA se manifestent par : l'utilisation d'incitations distribuées pour coordonner l'offre potentielle dans la longue traîne ------ à travers les données, le stockage et le calcul ; en même temps, établir un modèle open source ainsi qu'un marché décentralisé pour les agents IA.

  3. L'IA dans l'industrie Web3 est principalement utilisée dans la finance sur la chaîne (paiements cryptographiques, transactions, analyse de données) et pour aider au développement.

  4. L'utilité de l'IA+Web3 réside dans la complémentarité des deux : Web3 espère lutter contre la centralisation de l'IA, et l'IA espère aider Web3 à sortir de ses limites.

AI+Web3 : Tours et Places

Introduction

Au cours des deux dernières années, le développement de l'IA a été propulsé comme si un bouton d'accélération avait été pressé. Ce battement d'ailes de papillon provoqué par Chatgpt a non seulement ouvert un nouveau monde pour l'intelligence artificielle générative, mais a également suscité un courant puissant dans le Web3.

Sous l'impulsion du concept d'IA, le financement du marché des cryptomonnaies, bien que ralentissant, montre une nette amélioration. Selon les statistiques des médias, rien qu'au premier semestre 2024, 64 projets Web3+IA ont terminé leur financement, et le système d'exploitation basé sur l'intelligence artificielle Zyber365 a atteint un montant de financement record de 100 millions de dollars lors de sa série A.

Le marché secondaire est de plus en plus prospère. Selon les données d'un certain site, en un peu plus d'un an, la capitalisation boursière totale du secteur de l'IA a atteint 48,5 milliards de dollars, avec un volume de transactions de près de 8,6 milliards de dollars en 24 heures ; les avancées des technologies d'IA ont clairement apporté des avantages, et après la publication du modèle Sora de conversion de texte en vidéo par une certaine entreprise, le prix moyen du secteur de l'IA a augmenté de 151 % ; l'effet de l'IA s'étend également à l'un des secteurs d'attraction de capital des crypto-monnaies, à savoir les Memes : le premier concept de MemeCoin avec un Agent IA ------ GOAT a rapidement gagné en popularité et a obtenu une valorisation de 1,4 milliard de dollars, lançant avec succès la tendance des Memes IA.

La recherche et les sujets liés à AI+Web3 sont également très animés, passant de AI+Depin à AI Memecoin, puis aux actuels AI Agent et AI DAO. L'émotion FOMO ne parvient déjà plus à suivre la vitesse de rotation des nouveaux récits.

AI+Web3, cette combinaison de termes remplie d'argent chaud, de tendances et de fantasmes futurs, est inévitablement perçue comme un mariage arrangé orchestré par le capital. Il semble que nous ayons du mal à distinguer sous ce manteau flamboyant, s'il s'agit du terrain des spéculateurs ou de la veille de l'explosion de l'aube ?

Pour répondre à cette question, une réflexion clé pour les deux parties est : est-ce que cela s'améliorerait grâce à l'autre ? Peut-on bénéficier des modèles de l'autre ? Dans cet article, nous essayons également d'examiner ce schéma en nous appuyant sur les travaux des précédents : comment Web3 peut-il jouer un rôle à chaque étape de la pile technologique de l'IA, et qu'est-ce que l'IA peut apporter de nouveau à Web3 ?

Partie 1 Quelles sont les opportunités du Web3 sous la pile AI ?

Avant d'aborder ce sujet, nous devons comprendre la pile technologique des grands modèles d'IA :

S'exprimer en des termes plus simples sur l'ensemble du processus : un « grand modèle » est comme le cerveau humain. À ses débuts, ce cerveau appartient à un bébé qui vient de naître et qui doit observer et absorber une quantité massive d'informations provenant de son environnement pour comprendre ce monde. C'est la phase de « collecte » des données. Étant donné que les ordinateurs ne possèdent pas les sens humains comme la vue et l'audition, avant l'entraînement, les vastes informations non étiquetées du monde extérieur doivent être transformées par « prétraitement » en un format d'information que l'ordinateur peut comprendre et utiliser.

Après avoir entré les données, l'IA construit un modèle capable de compréhension et de prédiction grâce à l'« entraînement », ce qui peut être considéré comme le processus par lequel un bébé comprend et apprend progressivement le monde extérieur. Les paramètres du modèle ressemblent aux capacités linguistiques qui s'ajustent continuellement au cours du processus d'apprentissage du bébé. Lorsque le contenu appris commence à se spécialiser ou lorsque des retours d'expérience sont obtenus par la communication avec d'autres et que des corrections sont apportées, cela entre dans la phase de « fine-tuning » du grand modèle.

Les enfants, en grandissant et en apprenant à parler, peuvent comprendre le sens et exprimer leurs sentiments et idées dans de nouvelles conversations. Cette phase est similaire au « raisonnement » des grands modèles d'IA, où le modèle est capable de prédire et d'analyser de nouvelles entrées linguistiques et textuelles. Les bébés expriment leurs sentiments, décrivent des objets et résolvent divers problèmes grâce à leurs compétences linguistiques, ce qui est également comparable à l'application des grands modèles d'IA dans la phase de raisonnement après leur formation pour diverses tâches spécifiques, telles que la classification d'images, la reconnaissance vocale, etc.

L'agent IA s'approche davantage de la prochaine forme des grands modèles ------ capable d'exécuter des tâches de manière autonome et de poursuivre des objectifs complexes, non seulement doté de capacités de réflexion, mais également capable de mémoire, de planification, et capable d'utiliser des outils pour interagir avec le monde.

Actuellement, face aux points de douleur de l'IA dans différentes couches, le Web3 a commencé à former un écosystème multicouche et interconnecté, couvrant toutes les étapes du processus de modèle d'IA.

AI+Web3 : Tours et places

Un, couche de base : Airbnb de la puissance de calcul et des données

Puissance de calcul

Actuellement, l'un des coûts les plus élevés de l'IA est la puissance de calcul et l'énergie nécessaires pour entraîner et inférer des modèles.

Un exemple est qu'un modèle d'une certaine entreprise nécessite 16 000 GPU d'un certain modèle fabriqués par cette entreprise (qui est une unité de traitement graphique haut de gamme conçue pour les charges de travail en intelligence artificielle et en calcul haute performance). La formation prend 30 jours. Le prix unitaire de la version 80 Go se situe entre 30 000 et 40 000 dollars, ce qui nécessite un investissement en matériel de calcul de 400 à 700 millions de dollars (GPU + puces réseau), tandis que la formation mensuelle consomme 1,6 milliard de kilowattheures, avec des dépenses énergétiques de près de 20 millions de dollars par mois.

La décompression de la puissance de calcul AI est également l'un des premiers domaines où Web3 croise l'AI------DePin (réseau d'infrastructure physique décentralisée). Actuellement, un site de données a déjà répertorié plus de 1400 projets, parmi lesquels des projets représentant le partage de puissance de calcul GPU incluent io.net, Aethir, Akash, Render Network, etc.

La logique principale réside dans le fait que la plateforme permet aux particuliers ou entités disposant de ressources GPU inoccupées de contribuer à leur capacité de calcul de manière décentralisée et sans autorisation, en créant un marché en ligne pour acheteurs et vendeurs similaire à Uber ou Airbnb, augmentant ainsi le taux d'utilisation des ressources GPU sous-utilisées. Les utilisateurs finaux bénéficient également de ressources de calcul efficaces à moindre coût ; par ailleurs, le mécanisme de staking garantit que si des violations des mécanismes de contrôle de qualité ou des interruptions du réseau se produisent, les fournisseurs de ressources subissent des sanctions appropriées.

Ses caractéristiques sont :

  • Rassembler des ressources GPU inutilisées : Les fournisseurs sont principalement des centres de données indépendants de taille petite à moyenne, des opérateurs de surplus de puissance de calcul de mines de crypto-monnaies, et des matériels de minage avec un mécanisme de consensus PoS, tels que les machines de minage FileCoin et ETH. Actuellement, certains projets s'efforcent de lancer des dispositifs avec des barrières d'entrée plus faibles, comme exolab qui utilise des appareils locaux tels que MacBook, iPhone, iPad pour établir un réseau de puissance de calcul pour l'inférence de grands modèles.

  • Faire face au marché de la longue traîne de la puissance de calcul AI :

a. « En termes de technologie », le marché de la puissance de calcul décentralisée est plus adapté aux étapes d'inférence. L'entraînement dépend davantage de la capacité de traitement des données offerte par des GPU à très grande échelle, tandis que l'inférence nécessite des performances de calcul GPU relativement faibles, comme Aethir qui se concentre sur le rendu à faible latence et les applications d'inférence AI.

b. "Du côté de la demande", les petites et moyennes entreprises en matière de puissance de calcul ne formeront pas leur propre grand modèle, mais choisiront simplement d'optimiser et d'ajuster autour de quelques grands modèles de tête, et ces scénarios conviennent naturellement aux ressources de calcul inutilisées distribuées.

  • Propriété décentralisée : la signification technique de la blockchain réside dans le fait que les propriétaires de ressources conservent toujours le contrôle sur leurs ressources, ajustant leur utilisation en fonction de la demande tout en réalisant des bénéfices.

Données

Les données sont la base de l'IA. Sans données, le calcul est aussi inutile qu'une écorce flottante, et la relation entre les données et le modèle est comme le dicton "Garbage in, Garbage out". La quantité de données et la qualité des entrées déterminent la qualité de sortie du modèle final. Pour l'entraînement des modèles d'IA actuels, les données déterminent la capacité linguistique, la compréhension, voire les valeurs et l'humanisation du modèle. Actuellement, les défis en matière de demande de données pour l'IA se concentrent principalement sur quatre aspects :

  • Soif de données : l'entraînement des modèles d'IA dépend d'un grand volume d'entrées de données. Les données publiques montrent qu'une certaine entreprise a atteint un niveau de paramètres d'entraînement de modèle de l'ordre du trillion.

  • Qualité des données : Avec l'intégration de l'IA dans divers secteurs, la temporalité des données, la diversité des données, la spécialisation des données sectorielles et l'intégration de nouvelles sources de données, telles que les émotions sur les réseaux sociaux, posent de nouvelles exigences en matière de qualité.

  • Problèmes de confidentialité et de conformité : Les pays et entreprises prennent progressivement conscience de l'importance des ensembles de données de qualité et commencent à imposer des restrictions sur le crawling des ensembles de données.

  • Coûts de traitement des données élevés : volume de données important, processus de traitement complexe. Les données publiques montrent que plus de 30 % des coûts de R&D des entreprises d'IA sont consacrés à la collecte et au traitement des données de base.

Actuellement, les solutions web3 se manifestent dans les quatre domaines suivants :

  1. Collecte de données : la disponibilité des données du monde réel pouvant être collectées gratuitement est en train de s'épuiser rapidement, les dépenses des entreprises d'IA pour les données augmentent chaque année. Mais en même temps, ces dépenses ne profitent pas réellement aux véritables contributeurs de données, les plateformes profitent entièrement de la création de valeur générée par les données, comme une certaine plateforme qui a réalisé un revenu total de 203 millions de dollars grâce à un accord de licence de données signé avec une entreprise d'IA.

Permettre aux utilisateurs qui contribuent réellement de participer également à la création de valeur apportée par les données, et d'obtenir des données plus privées et plus précieuses grâce à un réseau distribué et un mécanisme d'incitation, de manière économique, est la vision de Web3.

  • Grass est une couche de données et un réseau décentralisés, permettant aux utilisateurs de contribuer à la bande passante inutilisée et au trafic de relais en exécutant des nœuds Grass pour capturer des données en temps réel provenant de l'ensemble d'Internet, et d'obtenir des récompenses en tokens ;

  • Vana a introduit un concept unique de pool de liquidité de données (DLP), permettant aux utilisateurs de télécharger leurs données personnelles (telles que les historiques d'achats, les habitudes de navigation, les activités sur les réseaux sociaux, etc.) dans un DLP spécifique et de choisir avec flexibilité s'ils souhaitent autoriser des tiers spécifiques à utiliser ces données ;

  • Dans PublicAI, les utilisateurs peuvent utiliser #AI 或#Web3 comme étiquette de classification sur une certaine plateforme et @PublicAI pour collecter des données.

  1. Prétraitement des données : dans le processus de traitement des données par l'IA, les données collectées sont souvent bruyantes et contiennent des erreurs, elles doivent donc être nettoyées et converties en un format utilisable avant l'entraînement du modèle, impliquant des tâches répétitives de normalisation, de filtrage et de traitement des valeurs manquantes. Cette étape est l'un des rares moments manuels dans l'industrie de l'IA, ayant donné naissance au métier de data annotator. Avec l'augmentation des exigences de qualité des données par les modèles, le seuil d'entrée pour les data annotators a également augmenté, et cette tâche est naturellement adaptée au mécanisme d'incitation décentralisé de Web3.
  • Actuellement, Grass et OpenLayer envisagent tous deux d'intégrer cette étape clé de l'annotation des données.

  • Synesis a proposé le concept de « Train2earn », soulignant l'importance de la qualité des données. Les utilisateurs peuvent obtenir des récompenses en fournissant des données annotées, des commentaires ou d'autres formes d'entrée.

  • Le projet de annotation de données Sapien gamifie les tâches de marquage et permet aux utilisateurs de miser des points pour en gagner plus.

  1. Confidentialité et sécurité des données : Il est important de clarifier que la confidentialité des données et la sécurité des données sont deux concepts différents. La confidentialité des données concerne le traitement des données sensibles, tandis que la sécurité des données protège les informations contre l'accès, la destruction et le vol non autorisés. Ainsi, les avantages technologiques de la confidentialité Web3 et les applications potentielles se manifestent dans deux domaines : (1) l'entraînement sur des données sensibles ; (2) la collaboration sur les données : plusieurs propriétaires de données peuvent participer ensemble à l'entraînement de l'IA sans avoir à partager leurs données brutes.

Les technologies de confidentialité actuellement courantes dans le Web3 incluent :

  • Environnement d'exécution de confiance ( TEE ), tel que Super Protocol ;

  • Chiffrement homomorphe complet (FHE), par exemple BasedAI, Fhenix.io ou Inco Network ;

  • La technologie des preuves à divulgation nulle de connaissance (zk), telle que le protocole Reclaim qui utilise la technologie zkTLS, génère des preuves à divulgation nulle de connaissance pour le trafic HTTPS, permettant aux utilisateurs d'importer en toute sécurité des activités, des données de réputation et d'identité depuis des sites externes, sans exposer d'informations sensibles.

Cependant, ce domaine en est encore à ses débuts, la plupart des projets sont encore en phase d'exploration. L'un des dilemmes actuels est le coût élevé des calculs, quelques exemples sont :

  • Le cadre zkML EZKL nécessite environ 80 minutes
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • 3
  • Partager
Commentaire
0/400
shadowy_supercodervip
· Il y a 12h
La technologie devrait habiliter équitablement.
Voir l'originalRépondre0
MEVHuntervip
· Il y a 12h
Prédire audacieusement sera très populaire
Voir l'originalRépondre0
LightningAllInHerovip
· Il y a 13h
Les deux épées combinées deviendront un grand outil.
Voir l'originalRépondre0
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)