اقتصاد

«المتعة والألم».. سر نجاح الـ AI

10 مارس 2025 02:11

بوسطن (الاتحاد)

أخبار ذات صلة

مدعومة بالذكاء الاصطناعي.."مايكرسوفت" تضيف أدوات بحث عميقة إلى "كوبيلوت"

شبكة أبوظبي للإعلام تحصد جائزة Oracle للابتكار

فاز العالمان أندرو بارتو وريتشارد ساتون الأسبوع الماضي بجائزة نوبل للحوسبة المعروفة باسم «تورينج» من جمعية آلات الحوسبة، التي تعد أكبر جمعية في العالم لمحترفي الحوسبة.
نال الباحثان البارزان الجائزة المرموقة عن إسهامهما الرائد في اكتشاف وتمكين الذكاء الاصطناعي، قبل عقود طويلة من ظهوره بشكل فعلي.
يتمحور الإنجاز الأساسي للعالمين في ابتكار ما يعرف باسم «التعليم المعزز»، وهي التقنية الأساسية التي ساعدت على تطوير القدرات الخارقة للذكاء الاصطناعي.
تقول صحيفة نيويورك تايمز، إن البداية كانت في عام 1977، عندما بدأ أندرو بارتو، كباحث في جامعة ماساتشوستس، أمهيرست، في استكشاف نظرية جديدة مفادها أن الخلايا العصبية عند الإنسان تتصرف مثل الشخص الشهواني، حيث تسعى مليارات الخلايا العصبية في الدماغ البشرية إلى تعظيم المتعة وتقليل الألم، ومع انضمام الباحث الشاب ريتشارد ساتون إلى بارتو، بدأ الاثنان استخدام هذه المفهوم للذكاء البشري وتطبيقه على الذكاء الاصطناعي. وكانت النتيجة «التعلم المعزز»، وهي طريقة لأنظمة الذكاء الاصطناعي للتعلم من المكافئ الرقمي للمتعة والألم، حسبما تقول «نيويورك تايمز»
ولعب «التعلم المعزز» دوراً حيوياً في صعود الذكاء الاصطناعي خلال العقد الماضي حتى إن تقنيات متقدمة مثل ChatGPT من OpenAI، جذورها الأساسية تكمن في جهود بارتو وساتون بشأن التعليم المعزز، خاصة في كتابهما الصادر عام 1998 بعنوان «التعلم المعزز: مقدمة» الذي بشرا فيه بأنه يمكن للآلات أن تتعلم بنفس الطريقة التي يتعلم بها الإنسان.
استفادت جوجل من النظرية في بناء نظام ذكي للعب الشطرنج أسمته AlphaGo في عام 2016. لعب النظام لعب ملايين الألعاب ضد نفسه، وتعلم عن طريق التجربة والخطأ حتى عرف الحركات التي جلبت النجاح (المتعة) وأيها جلبت الفشل (الألم). ومن هنا، بدأ التفكير في استخدام فكرة التعليم المعزز خارج نطاق الألعاب، حيث يمكن للآلات التمييز بين النجاح والفشل حتى وصلنا إلى مرحلة روبوتات الدردشة.
وقد لعب التعلم المعزز دوراً أساسياً في تطوير روبوتات الدردشة عبر الإنترنت، التي علمت نفسها بنفسها عبر ردود الفعل البشرية في بداية تجاربها الأولى.
تقول نيويورك تايمز، إنه في الفترة التي سبقت إصدار ChatGPT في خريف عام 2022، استأجرت OpenAI مئات الأشخاص لاستخدام إصدار مبكر وتقديم اقتراحات دقيقة يمكن أن تصقل مهاراتها.
ويسمي الباحثون هذا النموذج.. «التعلم المعزز من ردود الفعل البشرية»، وهو أحد الأسباب الرئيسية التي تجعل روبوتات الدردشة اليوم تستجيب بطرق نابضة بالحياة بشكل مدهش.