يعيش العالم الآن في عصر يتنافس فيه الجميع لبناء أفضل نماذج أساسية. على الرغم من أن القدرة الحاسوبية وهندسة النماذج مهمة، إلا أن الحاجز الحقيقي هو بيانات التدريب. أكبر خبر في دائرة الذكاء الاصطناعي هذا الشهر هو أن ميتا أظهرت قوتها، حيث قام مارك زوكربيرج بتوظيف الكثير من المواهب، وقام بتشكيل فريق ذكاء اصطناعي فاخر يضم بشكل رئيسي علماء باحثين من أصل صيني. قائد الفريق هو ألكسندر وانغ البالغ من العمر 28 عامًا، الذي أسس شركة Scale AI التي تقدر قيمتها حاليًا بـ 29 مليار دولار، وتقدم خدمات البيانات للعديد من عمالقة الذكاء الاصطناعي الذين لديهم علاقات تنافسية مثل الجيش الأمريكي وOpenAI وAnthropic وMeta. النشاط الرئيسي لشركة Scale AI هو توفير كميات كبيرة من البيانات المصنفة بدقة.
سر نجاح Scale AI
لقد تمكنت Scale AI من التميز بين العديد من أحصنة طروادة لأنها اكتشفت مبكراً أهمية البيانات في صناعة الذكاء الاصطناعي.
تعتبر القوة الحاسوبية والنموذج والبيانات الأعمدة الثلاثة الأساسية لنموذج الذكاء الاصطناعي. إذا تم تشبيه النموذج الكبير بشخص، فإن النموذج هو الجسد، والقوة الحاسوبية هي الطعام، بينما البيانات هي المعرفة/المعلومات.
في عملية التطور السريع لنماذج اللغة الكبيرة، حدث انتقال التركيز في الصناعة من النماذج إلى القدرة الحاسوبية. حاليًا، تم اعتماد معظم النماذج إطار العمل transformer، مع بعض الابتكارات مثل MoE أو MoRe بشكل متقطع؛ أما الشركات الكبرى فهي إما تبني تجمعات حوسبة فائقة خاصة بها أو توقع اتفاقيات طويلة الأمد مع مزودي الخدمات السحابية لحل مشكلات القدرة الحاسوبية. بعد تلبية الاحتياجات الأساسية للقدرة الحاسوبية، بدأت أهمية البيانات تتضح تدريجيًا.
تسعى Scale AI إلى إنشاء أساس بيانات قوي لنماذج الذكاء الاصطناعي، حيث تشمل أعمالها ليس فقط استخراج البيانات الموجودة، ولكن أيضًا التركيز على أعمال توليد البيانات على المدى الطويل. وتقوم الشركة بتكوين فرق تدريب الذكاء الاصطناعي من خبراء بشريين في مجالات مختلفة، بهدف توفير بيانات ذات جودة أفضل لتدريب نماذج الذكاء الاصطناعي.
مرحلتان لتدريب النموذج
تنقسم عملية تدريب النموذج إلى جزئين: التدريب المسبق والتعديل.
يتطلب التدريب المسبق عملية مشابهة لعملية تعلم الأطفال البشريين الكلام، حيث يجب إدخال كمية كبيرة من النصوص والأكواد وغيرها من المعلومات المجمعة من الإنترنت إلى نموذج الذكاء الاصطناعي، مما يسمح للنموذج باكتساب مهارات التواصل الأساسية من خلال التعلم الذاتي.
تشبه التعديلات الدقيقة الذهاب إلى المدرسة، حيث يكون هناك عادةً صواب وخطأ، وإجابات واتجاهات واضحة. ستقوم "مدارس" مختلفة بتربية "مواهب" بخصائص مختلفة. من خلال بعض مجموعات البيانات المدروسة والمخصصة بعناية، نجعل النموذج يمتلك القدرات التي نأمل فيها.
لذلك، نحتاج إلى فئتين من البيانات:
بيانات ضخمة لا تحتاج إلى معالجة كثيرة، تأتي بشكل رئيسي من بيانات الزحف من منصات UGC الكبيرة، وقواعد البيانات الأدبية العامة، وقواعد البيانات الخاصة بالشركات.
مجموعة بيانات متخصصة تم تصميمها وتصفيتها بعناية، تحتاج إلى عمليات تنظيف البيانات، وتصفيتها، ووضع العلامات، والتعليقات اليدوية، وما إلى ذلك.
تشكل هاتان الفئتان من مجموعات البيانات جوهر مسار بيانات الذكاء الاصطناعي. يُعتقد حاليًا أنه مع تلاشي ميزة القدرة الحاسوبية تدريجياً، ستصبح البيانات مفتاحًا للحفاظ على تنافسية الشركات المصنعة للنماذج الكبيرة.
مع زيادة قدرة النموذج، ستصبح مجموعات البيانات التدريبية المختلفة الأكثر دقة واحترافية هي العوامل الحاسمة في تحديد قدرة النموذج. إذا كانت عملية تدريب النموذج تشبه تربية خبراء فنون القتال، فإن مجموعة البيانات عالية الجودة هي أفضل كتب فنون القتال.
على المدى الطويل، تعتبر بيانات الذكاء الاصطناعي مجالًا طويل الأمد لديه تأثير كرة الثلج. مع تراكم العمل الأولي، ستكتسب أصول البيانات القدرة على الفائدة المركبة، وستزداد قيمتها مع مرور الوقت.
Web3 DataFi: التربة المثالية لبيانات الذكاء الاصطناعي
بالمقارنة مع شركات البيانات التقليدية، تتمتع Web3 بميزة طبيعية في مجال بيانات الذكاء الاصطناعي، ومن هنا نشأ مفهوم DataFi.
في الظروف المثالية، تشمل مزايا Web3 DataFi:
تضمن العقود الذكية سيادة البيانات والأمان والخصوصية
يجذب الهيكل المعتمد على التوزيع أفضل قوى العمل العالمية المناسبة
توفر البلوكشين مزايا واضحة للتحفيز والتسوية
يساعد في بناء سوق بيانات شامل وفعال ومفتوح
بالنسبة للمستخدمين العاديين، فإن DataFi هو أسهل مشروع للذكاء الاصطناعي اللامركزي للمشاركة. يمكن للمستخدمين ببساطة تسجيل الدخول إلى المحفظة، والمشاركة من خلال إكمال مهام متنوعة مثل تقديم البيانات، وتقييم النماذج، واستخدام أدوات الذكاء الاصطناعي للإبداع البسيط، والمشاركة في تداول البيانات.
المشاريع الواعدة في Web3 DataFi
لقد حصلت العديد من مشاريع DataFi على تمويل كبير، وفيما يلي بعض المشاريع التمثيلية:
Sahara AI: تهدف إلى إنشاء بنية تحتية لامركزية للذكاء الاصطناعي وسوق للتداول
يوب: منصة ردود فعل نموذج الذكاء الاصطناعي، تجمع تقييمات المستخدمين لمخرجات النموذج
Vana: تحويل البيانات الشخصية للمستخدمين إلى أصول رقمية قابلة للتداول
Chainbase: يركز على بيانات السلسلة، ويغطي أكثر من 200 سلسلة كتلة
Sapien: تحويل المعرفة البشرية إلى بيانات تدريب عالية الجودة للذكاء الاصطناعي
Prisma X: يهدف إلى بناء طبقة تنسيق مفتوحة للروبوتات
Masa: مشروع شبكة فرعية في نظام Bittensor البيئي، يوفر الوصول إلى البيانات في الوقت الحقيقي
Irys: يركز على التخزين والبيانات القابلة للبرمجة والحساب
ORO: تمكين الناس العاديين من المشاركة في مساهمات الذكاء الاصطناعي
Gata: طبقة بيانات لامركزية، تقدم طرقًا متعددة للمشاركة في البيانات
هذه المشاريع لديها حواجز منخفضة بشكل عام في الوقت الحالي، ولكن مع تراكم المستخدمين ومرونة النظام البيئي، ستتكون مزايا المنصة بسرعة. يجب أن تركز المشاريع المبكرة على التحفيز وتجربة المستخدم لجذب عدد كافٍ من المستخدمين.
في الوقت نفسه، تحتاج هذه المنصات إلى الانتباه إلى كيفية إدارة العمالة وضمان جودة البيانات، وتجنب ظاهرة "طرد العملات الجيدة بسبب العملات السيئة" الناتجة عن "أصحاب القمصان الصوفية". بدأت بعض المشاريع مثل Sahara وSapien في التأكيد على جودة البيانات، وتسعى جاهدة لبناء علاقات تعاون صحية وطويلة الأمد مع مستخدمي المنصة.
علاوة على ذلك، فإن زيادة الشفافية تعد أيضًا تحديًا تواجهه المشاريع على السلسلة الحالية. لا تزال العديد من المشاريع بحاجة إلى تسريع خطواتها نحو الانفتاح والشفافية لتعزيز التنمية الصحية طويلة الأجل لـ Web3 DataFi.
يتطلب التبني الواسع لـ DataFi التقدم من جانبيْن: الأول هو جذب عدد كافٍ من المستخدمين الأفراد للمشاركة في جمع/توليد البيانات، لتشكيل مجموعة المستهلكين في اقتصاد الذكاء الاصطناعي؛ والثاني هو الحصول على اعتراف الشركات الرئيسية، لأنها المصدر الرئيسي للبيانات الكبيرة على المدى القصير.
الخاتمة
من زاوية معينة، تعتبر DataFi زراعة الذكاء الاصطناعي باستخدام الذكاء البشري على المدى الطويل، مع ضمان عائدات العمل البشري من خلال العقود الذكية، وفي النهاية الاستفادة من عوائد الذكاء الاصطناعي.
بالنسبة لأولئك الذين يشعرون بعدم اليقين في عصر الذكاء الاصطناعي أو لا يزال لديهم طموحات في مجال blockchain ، فإن اتباع خطوات عمالقة رأس المال والانغماس في DataFi هو خيار جيد يتماشى مع الاتجاه.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 16
أعجبني
16
4
مشاركة
تعليق
0/400
SneakyFlashloan
· منذ 20 س
يا إلهي، 290 مليار في سن 28، يجب أن أعمل بجد.
شاهد النسخة الأصليةرد0
MetaMuskRat
· منذ 20 س
مرة أخرى ، زاك يفعل شيئًا مضحكًا
شاهد النسخة الأصليةرد0
NftDataDetective
· منذ 20 س
يبدو أن زوكربيرغ أخيرًا يفهم ذلك... البيانات هي النفط الجديد حقًا
شاهد النسخة الأصليةرد0
AirdropChaser
· منذ 20 س
قفز قفز انظر، إنها مشروع غني حقًا، حان الوقت للتخطيط.
DataFi: الاتجاه الجديد لتحويل بيانات الذكاء الاصطناعي إلى أصول في Web3
البيانات هي الأصول: DataFi تفتح بحرًا جديدًا
يعيش العالم الآن في عصر يتنافس فيه الجميع لبناء أفضل نماذج أساسية. على الرغم من أن القدرة الحاسوبية وهندسة النماذج مهمة، إلا أن الحاجز الحقيقي هو بيانات التدريب. أكبر خبر في دائرة الذكاء الاصطناعي هذا الشهر هو أن ميتا أظهرت قوتها، حيث قام مارك زوكربيرج بتوظيف الكثير من المواهب، وقام بتشكيل فريق ذكاء اصطناعي فاخر يضم بشكل رئيسي علماء باحثين من أصل صيني. قائد الفريق هو ألكسندر وانغ البالغ من العمر 28 عامًا، الذي أسس شركة Scale AI التي تقدر قيمتها حاليًا بـ 29 مليار دولار، وتقدم خدمات البيانات للعديد من عمالقة الذكاء الاصطناعي الذين لديهم علاقات تنافسية مثل الجيش الأمريكي وOpenAI وAnthropic وMeta. النشاط الرئيسي لشركة Scale AI هو توفير كميات كبيرة من البيانات المصنفة بدقة.
سر نجاح Scale AI
لقد تمكنت Scale AI من التميز بين العديد من أحصنة طروادة لأنها اكتشفت مبكراً أهمية البيانات في صناعة الذكاء الاصطناعي.
تعتبر القوة الحاسوبية والنموذج والبيانات الأعمدة الثلاثة الأساسية لنموذج الذكاء الاصطناعي. إذا تم تشبيه النموذج الكبير بشخص، فإن النموذج هو الجسد، والقوة الحاسوبية هي الطعام، بينما البيانات هي المعرفة/المعلومات.
في عملية التطور السريع لنماذج اللغة الكبيرة، حدث انتقال التركيز في الصناعة من النماذج إلى القدرة الحاسوبية. حاليًا، تم اعتماد معظم النماذج إطار العمل transformer، مع بعض الابتكارات مثل MoE أو MoRe بشكل متقطع؛ أما الشركات الكبرى فهي إما تبني تجمعات حوسبة فائقة خاصة بها أو توقع اتفاقيات طويلة الأمد مع مزودي الخدمات السحابية لحل مشكلات القدرة الحاسوبية. بعد تلبية الاحتياجات الأساسية للقدرة الحاسوبية، بدأت أهمية البيانات تتضح تدريجيًا.
تسعى Scale AI إلى إنشاء أساس بيانات قوي لنماذج الذكاء الاصطناعي، حيث تشمل أعمالها ليس فقط استخراج البيانات الموجودة، ولكن أيضًا التركيز على أعمال توليد البيانات على المدى الطويل. وتقوم الشركة بتكوين فرق تدريب الذكاء الاصطناعي من خبراء بشريين في مجالات مختلفة، بهدف توفير بيانات ذات جودة أفضل لتدريب نماذج الذكاء الاصطناعي.
مرحلتان لتدريب النموذج
تنقسم عملية تدريب النموذج إلى جزئين: التدريب المسبق والتعديل.
يتطلب التدريب المسبق عملية مشابهة لعملية تعلم الأطفال البشريين الكلام، حيث يجب إدخال كمية كبيرة من النصوص والأكواد وغيرها من المعلومات المجمعة من الإنترنت إلى نموذج الذكاء الاصطناعي، مما يسمح للنموذج باكتساب مهارات التواصل الأساسية من خلال التعلم الذاتي.
تشبه التعديلات الدقيقة الذهاب إلى المدرسة، حيث يكون هناك عادةً صواب وخطأ، وإجابات واتجاهات واضحة. ستقوم "مدارس" مختلفة بتربية "مواهب" بخصائص مختلفة. من خلال بعض مجموعات البيانات المدروسة والمخصصة بعناية، نجعل النموذج يمتلك القدرات التي نأمل فيها.
لذلك، نحتاج إلى فئتين من البيانات:
بيانات ضخمة لا تحتاج إلى معالجة كثيرة، تأتي بشكل رئيسي من بيانات الزحف من منصات UGC الكبيرة، وقواعد البيانات الأدبية العامة، وقواعد البيانات الخاصة بالشركات.
مجموعة بيانات متخصصة تم تصميمها وتصفيتها بعناية، تحتاج إلى عمليات تنظيف البيانات، وتصفيتها، ووضع العلامات، والتعليقات اليدوية، وما إلى ذلك.
تشكل هاتان الفئتان من مجموعات البيانات جوهر مسار بيانات الذكاء الاصطناعي. يُعتقد حاليًا أنه مع تلاشي ميزة القدرة الحاسوبية تدريجياً، ستصبح البيانات مفتاحًا للحفاظ على تنافسية الشركات المصنعة للنماذج الكبيرة.
مع زيادة قدرة النموذج، ستصبح مجموعات البيانات التدريبية المختلفة الأكثر دقة واحترافية هي العوامل الحاسمة في تحديد قدرة النموذج. إذا كانت عملية تدريب النموذج تشبه تربية خبراء فنون القتال، فإن مجموعة البيانات عالية الجودة هي أفضل كتب فنون القتال.
على المدى الطويل، تعتبر بيانات الذكاء الاصطناعي مجالًا طويل الأمد لديه تأثير كرة الثلج. مع تراكم العمل الأولي، ستكتسب أصول البيانات القدرة على الفائدة المركبة، وستزداد قيمتها مع مرور الوقت.
Web3 DataFi: التربة المثالية لبيانات الذكاء الاصطناعي
بالمقارنة مع شركات البيانات التقليدية، تتمتع Web3 بميزة طبيعية في مجال بيانات الذكاء الاصطناعي، ومن هنا نشأ مفهوم DataFi.
في الظروف المثالية، تشمل مزايا Web3 DataFi:
بالنسبة للمستخدمين العاديين، فإن DataFi هو أسهل مشروع للذكاء الاصطناعي اللامركزي للمشاركة. يمكن للمستخدمين ببساطة تسجيل الدخول إلى المحفظة، والمشاركة من خلال إكمال مهام متنوعة مثل تقديم البيانات، وتقييم النماذج، واستخدام أدوات الذكاء الاصطناعي للإبداع البسيط، والمشاركة في تداول البيانات.
المشاريع الواعدة في Web3 DataFi
لقد حصلت العديد من مشاريع DataFi على تمويل كبير، وفيما يلي بعض المشاريع التمثيلية:
هذه المشاريع لديها حواجز منخفضة بشكل عام في الوقت الحالي، ولكن مع تراكم المستخدمين ومرونة النظام البيئي، ستتكون مزايا المنصة بسرعة. يجب أن تركز المشاريع المبكرة على التحفيز وتجربة المستخدم لجذب عدد كافٍ من المستخدمين.
في الوقت نفسه، تحتاج هذه المنصات إلى الانتباه إلى كيفية إدارة العمالة وضمان جودة البيانات، وتجنب ظاهرة "طرد العملات الجيدة بسبب العملات السيئة" الناتجة عن "أصحاب القمصان الصوفية". بدأت بعض المشاريع مثل Sahara وSapien في التأكيد على جودة البيانات، وتسعى جاهدة لبناء علاقات تعاون صحية وطويلة الأمد مع مستخدمي المنصة.
علاوة على ذلك، فإن زيادة الشفافية تعد أيضًا تحديًا تواجهه المشاريع على السلسلة الحالية. لا تزال العديد من المشاريع بحاجة إلى تسريع خطواتها نحو الانفتاح والشفافية لتعزيز التنمية الصحية طويلة الأجل لـ Web3 DataFi.
يتطلب التبني الواسع لـ DataFi التقدم من جانبيْن: الأول هو جذب عدد كافٍ من المستخدمين الأفراد للمشاركة في جمع/توليد البيانات، لتشكيل مجموعة المستهلكين في اقتصاد الذكاء الاصطناعي؛ والثاني هو الحصول على اعتراف الشركات الرئيسية، لأنها المصدر الرئيسي للبيانات الكبيرة على المدى القصير.
الخاتمة
من زاوية معينة، تعتبر DataFi زراعة الذكاء الاصطناعي باستخدام الذكاء البشري على المدى الطويل، مع ضمان عائدات العمل البشري من خلال العقود الذكية، وفي النهاية الاستفادة من عوائد الذكاء الاصطناعي.
بالنسبة لأولئك الذين يشعرون بعدم اليقين في عصر الذكاء الاصطناعي أو لا يزال لديهم طموحات في مجال blockchain ، فإن اتباع خطوات عمالقة رأس المال والانغماس في DataFi هو خيار جيد يتماشى مع الاتجاه.