كيف تعلم الكومبيوتر الخداع في البوكر؟

Beautiful-small-gift-font-b-poker-b-font-font-b-computer-b-font-mouse-pad-mouse

 

*

*

نجح الكومبيوتر بالفعل في هزيمة الإنسان في الشطرنج وفي جيوباردي! قريبًا جدًا ربما ينضم البوكر لهذه القائمة.

في وقت مبكر من الشهر الحالي، قامت مواجهة بين أفضل لاعبي البوكر في العالم وبين برنامج ذكاء اصطناعي يدعى “كلاوديكو” Claudico في لعبة اليقظه – بلا حدود – تكساس هولد ام Heads-Up No-Limit Texas Hold ’em في كايزنو ريفرز Rivers في بيتسبيرج. بعد اسبوعين من المنافسة و80,000 جولة، فاز اللاعبون البشر بفيشات أكثر من البرنامج، لكن ليس ما يكفي لتخطي الحاجز الذي يجعل من ذلك حقيقة علمية.

*

يقول العلماء أن الأمر لن يستغرق وقتًا طويلا قبل أن يصبح برنامج لعب البوكر قادرًا على تخطي الإنسان.

*

يقول تيوماس ساندهولم Tuomas Sandholm  وهو عالم كومبيوتر بجامعة كارنيجي ميللون Carnegie Mellon University في بيتسبرج، ورئيس الفريق الذي صنع كلاوديكو: “أخمن أن [برنامج لعب البوكر الذكي] سيكون أقوى من أفضل البشر في العالم في غضون سنة إلى خمس سنوات”. لكنه، كما يضيف ساندهولم، حتى مع اقتراب الذكاء الاصطناعي من مستوى اللاعب البشري، سيستغرق الأمر جولات لعب أكثر بكثير حتى يمكن إعلان فوز البرنامج بشكل حقيقي.

*

أحد أشهر انجازات الذكاء الاصطناعي كان عندما قام الكومبيوتر لاعب الشطرنج المسمى ديب بلو Deep Blue والذي صنعته آي.بي.إم بهزيمة بطل العالم المتوج جاري كاسباروف Garry Kasparov. لكنه، على عكس الشطرنج، فإن البوكر هو لعبة غير كاملة المعلومات، فاللاعبون لا يملكون المعرفة بأفضل الخطط والاستراتيجيات للاعبين الآخرين. كما يقول ساندهولم للايف ساينس “البوكر مرتبط بعالم الواقع أكثر بكثير من الشطرنج”.

*

من أهم استراتيجيات البوكر هو فن الخداع، حيث يقترح اللاعب رهانًا أو يزايد في رهان دون أن يكون معه أفضل الورق، من اجل خداع خصم لدفعه للإنسحاب Folding. يقول ساندهولم: “يرى الناس عادة أن الخداع هو ظاهرة نفسية”، لكن فيما وراء علم النفس، يقول ساندهولم، “يثبت الخداع أنه ظاهرة استراتيجية”.

*

لم يقم ساندهولم وزملاؤه بعمل برمجة مسبقة لاستراتيجية كلاوديكو في البوكر، ولكن الفريق قام بكتابة خوارزميات تقوم بخلق استراتيجية تلقائيًا عن طريق محاولة الوصول لتوازن ناش Nash equilibrium. المبدأ جاء من نظرية اللعب Game Theory لعالم الرياضيات الأميريكي جون ناش John Nash، الذي جسدت شخصيته في فيلم “عقل جميل” A Beautifu Mind. في الألعاب غير التعاونية، يقال أن اللاعبين في “توازن ناش” إذا كانوا يتخذون أفضل القرارات المتاحة، آخذين في الاعتبار قرارات اللاعبين الآخرين.

*

قدرة كلاوديكو على لعب البوكر ربما تكون مدهشة، لكن ساندهولم وفريقه لم يطوروا هذا الذكاء الاصطناعي فقط للتفوق في لعبة ورق، على حد قولهم. قدرات كلاوديكو ذاتها التي تجعله متفوقًا في البوكر يمكن تطبيقها في كل شيء بداية من المزادات وحتى الأمن الألكتروني (السيبراني). فعلى سبيل المثال، طور ساندهولم وفريقه برنامج ذكاء اصطناعي مماثل لاكتشاف الترددات والطاقة التي يجب أن يستعملها الجيش من أجل التواصل اللاسلكي لكي يتفادى تشويش الإشارة من قبل العدو.

*

يقول ساندهولم: “عندما يتعلق الأمر بحل المشاكل بدون امتلاك المعلومات الكافية، يصبح البوكر معيارًا جيدًا”