ايتنا - هوش مصنوعی گوگل در بازی‌ استراتگو از انسان پیش افتاد

«دیپ‌نش»، بات هوش مصنوعی گوگل، بازی کردن با «استراتگو» را یاد گرفته است - یکی از معدود بازی‌های تخته‌ای که هوش مصنوعی در آن مهارت پیدا نکرده بود - و در بین بازیکنان انسانی ماهر و خبره، در نهایت به سه رده اول راه پیدا کرده است.

بررسی‌های قبلی نشان داده‌اند که هوش مصنوعی می‌تواند خود را برای یادگیری بازی‌هایی مانند شطرنج و «گو» (Go) از نقطه صفر آموزش دهد و حتی بر آن بازی‌ها مسلط شود و بر رقبای انسانی پیروز شود.

با این حال، استراتگو چالشی را برای هوش مصنوعی ایجاد کرد، چرا که پیچیده‌تر است و بر اطلاعات ناکامل اتکا دارد- و در آن بازیکنان نمی‌توانند هویت مهره‌های رقیب خود را مستقیما مشاهده کنند.

استراتگو یک بازی نوبتی براساس بلوف و تاکتیک است که شامل گردآوری اطلاعات و تدابیر زیرکانه است که در آن هر گونه عایدی یک بازیکن، به همان اندازه برای رقیبشان ضرر محسوب می‌شود.

محققان از جمله کارل تویلز از دیپ‌مایند گوگل، می‌گویند ماهر شدن و تسلط یافتن برای هوش مصنوعی به‌طور خاص چالش‌برانگیز است، زیرا این بازی شامل تصمیم‌گیری بر اساس اطلاعات ناقص و ظرفیت بلوف‌زنی است.

دکتر تویلس، یکی از نویسندگان این مقاله از دیپ‌مایند، توضیح داد: «برخلاف بازی‌های تخته‌ای معروف مانند شطرنج یا گو، بازیکنان در استراتگو نمی‌توانند مستقیما هویت مهره‌های حریف را مشاهده کنند، در نتیجه روش‌های هوش مصنوعی که روی این قبیل بازی‌ها مانند آلفازیرو به‌خوبی کار می‌کردند – که به‌شدت بر جست‌وجو متکی بودند – به‌راحتی قابل انتقال به استراتگو نیستند.»

استراتگو بازی اطلاعات ناکامل است: بازیکنان نمی‌توانند مستقیما مهره‌های رقیب خود را مشاهده کنند.

این باعث می‌شود دیگر سامانه‌های مبتنی بر هوش مصنوعی نتوانند از سطح مبتدی فراتر بروند. همچنین به این معنی است که روش موفقی به نام «جست‌وجوی درخت بازی» به قدر کافی ارتقاپذیر نیست.

بازیکنان استراتژی و استدلال را بر روی یک سری اقدام‌های پی‌درپی به کار‌ می‌بندند بدون اینکه شناخت روشنی در مورد این داشته باشند که چگونه هر یک از این‌ها در نتیجه نهایی نقش دارند.

دانشمندان توضیح دادند که آن‌ها باید «همه نتایج ممکن را هنگام تصمیم‌گیری بسنجند و مقایسه کنند» و افزودند که تعداد حالت‌های احتمالی - ده به توان ۵۳۵ - در مقایسه با شطرنج، گو و پوکر هم «فراتر و زیادتر از حد تصور» است.

این بازی، به‌طور پی‌درپی توانایی بازیکن را در تصمیم‌گیری نسبتا آرام، مبتنی بر تامل و منطقی آزمایش می‌کند.

محققان می‌گویند همه این عوامل، تسلط بر استراتگو را برای جامعه هوش مصنوعی دشوار کرده است.

دانشمندان در مطالعه جدیدی که هفته گذشته در ژورنال ساینس منتشر شد، از باتی به نام دیپ‌نش گزارش دادند که در پیچیده‌ترین نوع این بازی، استراتگو کلاسیک، به عملکردی در سطح متخصص انسانی دست یافته است.

آن‌ها دیپ‌نش را در برابر پیشرفته‌ترین بات‌های مختلف استراتگو و همچنین بازیکنان متخصص انسانی آزمایش کردند.

این بات در برابر تمام بات‌هایی که با آن‌ها بازی کرد پیروز شد و به یک «سطح بازی بسیار رقابتی» در برابر بازیکنان متخصص انسانی استراتگو در «گراوُن» - یک پلتفرم بازی اینترنتی و بزرگ‌ترین پلتفرم (بستر) آنلاین برای استراتگو دست یافت.

دانشمندان می‌گویند که دیپ‌نش یک «استراتژی غیرقابل پیش‌بینی» را برای پیروز شدن توسعه داد و اضافه می‌کنند که راه‌اندازی اولیه آن به شکل قابل توجهی تغییر کرده تا از این موضوع جلوگیری کند که حریفش طی یک سری از بازی‌ها، الگوهای هوش مصنوعی را تشخیص دهد.

این مطالعه افزود کرد که بات هوش مصنوعی حتی یاد گرفت که با استفاده از مهره‌های ضعیف‌تر به‌طوری که انگار مهره‌های رده بالایی‌اند، به حریف خود بلوف بزند.

وینسنت دی بوئر، یکی از نویسندگان این مقاله، طی سخنانی گفت: «سطح بازی دیپ‌نش من را شگفت‌زده کرد. من هرگز درباره یک بازیکن مصنوعی استراتگو که در برابر یک بازیکن انسانی با تجربه، به سطح لازم برای پیروزی در یک مسابقه نزدیک شده بود، نشنیده بودم.»

او گفت: «اما پس از اینکه خودم در برابر دیپ‌نش بازی کردم، از رتبه ۳ که بعدا در پلتفرم گراوُن به دست آورد، شگفت‌زده نشدم. من انتظار دارم که اگر اجازه شرکت در مسابقات جهانی انسانی را بیابد، بسیار عالی نتیجه بگیرد.»

دانشمندان باور داشتند که یافته‌های این مطالعه می‌تواند به چند مشکل چندعاملی در دنیای واقعی منجر شود که با تعداد نجومی حالت‌‌ها سروکار دارد و با اطلاعات ناقص و ناکاملی مشخص شود که در حال حاضر برای روش‌های پیشرفته هوش مصنوعی دور از دسترس است.

پژوهشگران در این مقاله نوشتند: «کاربردهای بسیاری را می‌توان در این دسته بزرگ‌تر از بازی‌ها یافت، از جمله مدل‌سازی جمعیت و ترافیک، شبکه هوشمند، طراحی حراج و مشکلات بازار.»

منبع: ایندیپندنت