رغم الاهتمام العالمي المتزايد بتقنيات الذكاء الاصطناعي ومساعديه الرقميين، إلا أن الواقع لا يزال بعيدًا عن الكمال، حيث أظهرت تجربة حديثة ضعف أداء ChatGPT في واحدة من أبسط التحديات الكلاسيكية، وهي لعبة الشطرنج
في تجربة نظمها المهندس روبرت كاروسو من شركة Citrix، واجه ChatGPT برنامج شطرنج بدائي أطلق عام 1977 على جهاز Atari 2600، وهو من أقدم أجهزة الألعاب المنزلية، وكانت النتيجة هزيمة ساحقة للذكاء الاصطناعي، كما وصفها كاروسو نفسه
من نفس التصنيف: ساعة شاومي الجديدة تأتي بتصميم مفاجئ وعمر بطارية طويل
أخطاء فادحة وتخلي عن المباراة
خلال المباراة، ارتكب ChatGPT سلسلة من الأخطاء التي تعكس عدم قدرته على متابعة اللعبة بشكل منطقي، فقد أخطأ في تحديد أماكن القطع، ونسي أي القطع يملكها، بل وقدم تضحيات غير مبررة مثل التضحية بحصانه مقابل بيدق.
مقال له علاقة: شيفروليه سبارك هاتشباك بسعر 250 ألف جنيه
قال كاروسو إن ChatGPT اشتكى من أن رموز Atari كانت “مجردة جدًا” بالنسبة له لفهمها، ورغم تحويل اللعبة إلى ترميز شطرنجي تقليدي، استمرت الأخطاء، وبعد 90 دقيقة من التخبط، اعترف ChatGPT بالهزيمة وانسحب من المباراة.
الذكاء الاصطناعي ليس شاملاً كما يبدو
تؤكد هذه التجربة أن نماذج الذكاء الاصطناعي اللغوية مثل ChatGPT، رغم قدرتها على إنتاج النصوص والإجابات المعقدة، ليست مصممة لاتخاذ قرارات دقيقة أو لعب ألعاب استراتيجية مثل الشطرنج، فهي في جوهرها لا تزال أنظمة تتنبأ بالكلمات، وليست “عقولا” تفكر أو تخطط كما يتصور البعض.
ويقول المراقبون إن أدوات الذكاء الاصطناعي المتخصصة والمدربة على مهام معينة مثل برامج الشطرنج القديمة تظل أكثر كفاءة في مجالاتها المحددة مقارنة بنماذج الذكاء العام مثل ChatGPT.
تكشف تجارب أخرى محدودية الذكاء الاصطناعي في الألعاب
لم يكن اختبار الشطرنج هو المثال الوحيد، ففي تجربة أخرى، حاول مستخدم تشغيل نموذج o3 من OpenAI للعب Pokémon Red.
ولكن بعد 366 ساعة من اللعب المتواصل، لم ينجح النموذج حتى في الوصول إلى مرحلة “Victory Road”، وهو إنجاز يستطيع طفل صغير إتمامه خلال يوم أو يومين.
من جهة أخرى، أعلنت جوجل أن نموذج Gemini الخاص بها استطاع إنهاء لعبة Pokémon Blue، لكن استغرق الأمر أكثر من 800 ساعة.
خلل متكرر في ChatGPT يثير القلق
بالتزامن مع هذه الأخبار، اشتكى عدد كبير من المستخدمين على Reddit من تكرار توقف ChatGPT عن العمل خلال الأيام الماضية، الأمر الذي أثر على المستخدمين الذين يعتمدون عليه لإنجاز مهام تتراوح بين العمل والدراسة وحتى النوم.
وتشير بيانات موقع Downdetector إلى أن المشكلة استمرت لساعات مع ارتفاع في معدلات الأخطاء، خاصة في خدمات توليد الصور وواجهات برمجة التطبيقات.