فريق إكساي للمسك يطلق جروك 3: اختبار المعيار يتجاوز المنافسة، لتصور الفكر، وفهم خلق ألعاب جديدة

في 18 فبراير 2025، قاد ماسك فريق XAI في إطلاق رسمي لأحدث نموذج ذكاء اصطناعي Grok 3، وقدم في الحدث أداءً متميزًا لهذا النموذج في المنطق الرياضي، وفهم العلوم، وقدرته على الترميز. بالإضافة إلى النتائج التقليدية في الاختبارات، قدم Grok 3 تجربة مبتكرة في التفكير الفوري والإبداع، مما يظهر إمكانيات نماذج الذكاء الاصطناعي في التعامل مع مشاكل معقدة ومهام إبداعية في المستقبل.

تجاوز اختبار المعيار: Grok 3 فاز في ساحة المنافسة الذكية

GROK 3 يتم اختباره في ثلاث مجالات رئيسية:

الاستدلال الرياضي (معيار رياضيات المسابقة الثانوية AIME)

المعرفة العلمية (تغطي مشاكل الدكتوراه)

قدرة الترميز (تشمل برمجة المنافسات وأسئلة المقابلات الفنية بنمط LeetCode)

في جميع اختباراتها، أظهر Grok 3 أداءً متميزًا، لا يتجاوز منافسيها في السوق فحسب، بل وصلت نسختها الأصغر Grok 3 Mini أيضًا إلى مستوى القمة.

للتحقق مما إذا كانت الذكاء الاصطناعي مجرد ذاكرة للمواد التعليمية والشفرة المصدرية المفتوحة، أجرى الذكاء الاصطناعي المفتوح اختبارًا عميقًا على منصة Chatbot Arena. تمت إزالة العلامات التجارية وواجهة المستخدم بالكامل في هذا الاختبار، مما يتيح للمستخدمين مقارنة إجابتين لنظامي ذكاء اصطناعي دون علمهم، وفي النهاية، حلق Grok 3 إلى المرتبة الأولى في جميع الفئات، وتجاوز معدل الربح ELO 1,400، واستمر في الارتفاع، مما يظهر القدرة القتالية القوية.

GROK 3 عرض الاستدلال الفوري والإبداع

GROK 3 ليس فقط قادرًا على حل مشكلات الاختبارات الموحدة، ولكنه يظهر أيضًا القدرة على التفكير الفوري والإبداع.

  1. 3D الرسوم المتحركة للصاروخ: عملية تفكير الذكاء الاصطناعي

فريق XAI قدم سؤالًا تحديًا في الموقع: "إنشاء رسم بياني ثلاثي الأبعاد لمحاكاة إطلاق صاروخ من الأرض وهبوطه على المريخ، ثم العودة إلى الأرض في نافذة الإطلاق التالية". عندما يتعامل Grok 3 مع هذا النوع من الأسئلة، يوفر ميزة مبتكرة: "تصور العملية". يمكن للمستخدمين رؤية خطوات استنتاج الذكاء الاصطناعي على الفور، وحتى "دخول" داخل Grok 3 وقراءة كيفية معالجته للمشكلة.

نظرًا لأن هذا عرض توضيحي فوري، قد تحدث أخطاء في الذكاء الاصطناعي، لذا قام XAI بتشغيل عدة حالات موازية لضمان أن إصدارًا على الأقل يمكن أن ينجح في التشغيل. هذا يظهر مرونة الذكاء الاصطناعي في المهام المعقدة، واستكشاف فريق XAI لتفسير الذكاء الاصطناعي الفوري.

  1. الذكاء الاصطناعي يخلق لعبة جديدة: تتريس + بيجويلد

عرض بارز آخر هو قدرة Grok 3 على إنشاء ألعاب بشكل مستقل. تحدي الفريق للذكاء الاصطناعي: 'تصميم لعبة تجمع بين تتريس (Tetris) وبيجويلد (Bejeweled)'. تتطلب هذه المهمة الإبداعية من الذكاء الاصطناعي فهم ميكانيكيتي لعبتين وإنشاء تصميم لعبة جديد تمامًا.

الذكاء الاصطناعي التقليدي قد يقوم بنسخ الألعاب الحالية مباشرة، لكن Grok 3 قد أنشأت لعبة جديدة قابلة للعب، مما يثبت أن لديها القدرة على الابتكار والتطبيق بجانب المنطق.

لتحسين أداء AI في مهام عالية الصعوبة مثل هذه، قام XAI بتفعيل 'وضع الدماغ الكبير'، مما يتيح للنموذج استخدام موارد الحساب الأكبر لزيادة قدرته على الاستدلال والإبداع. وهذا يظهر أن مستقبل AI ليس فقط قادرًا على المحاكاة، بل يمكنه أيضًا إنشاء مفاهيم وحلول جديدة بالكامل.

GROK 3 الإمكانيات المستقبلية

GROK 3 ما زال قيد التدريب، وأكد فريق XAI: "ما نقدمه الآن هو نسخة اختبارية من GROK 3، ولكنها تتصدر السوق في العديد من المؤشرات. مع التحسين المستمر، ستكون النسخة الكاملة في المستقبل أكثر تنافسية."

وبالإضافة إلى ذلك، يتم تدريب XAI أيضًا على Grok 3 Mini Reasoning (نموذج استدلال مصغر)، وعلى الرغم من صغر حجمه، إلا أنه في بعض السياقات يتفوق على الإصدار الكامل، مما يظهر أن للذكاء الاصطناعي إمكانات كبيرة للنمو بعد فترة تدريب طويلة.

إطلاق Grok 3 ليس فقط يثبت قوة الذكاء الاصطناعي في الرياضيات والعلوم والترميز، بل يظهر أيضًا إمكانية التفكير الفوري للذكاء الاصطناعي وإبتكار مفاهيم جديدة للعالم. نقطتان ساطعتان في هذا العرض - "تصور عملية التفكير للذكاء الاصطناعي" و"خلق لعبة جديدة تمامًا بشكل مستقل" - تعني أن الذكاء الاصطناعي لم يعد مجرد منظم معلومات، بل يصبح حلاً حقيقيًا للمشاكل ودافعًا للابتكار.

هذا المقال يكشف عن فريق XAI الذي يقوده ماسك Grok 3: اختبار التفوق المعياري على المنافسة، والتفكير التصويري، وفهم خلق ألعاب جديدة، وظهر لأول مرة على ChainNews ABMedia.

XAI0.81%
GROK-1.24%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 1
  • مشاركة
تعليق
0/400
Ltx999vip
· 02-18 09:12
ثور!
شاهد النسخة الأصليةرد0
  • تثبيت