هوش مصنوعی گوگل در بازی استراتگو از انسان پیش افتاد
ایتنا - هوش مصنوعی میتواند خود را برای یادگیری بازیهایی مانند شطرنج و «گو» (Go) از نقطه صفر آموزش دهد.
«دیپنش»، بات هوش مصنوعی گوگل، بازی کردن با «استراتگو» را یاد گرفته است - یکی از معدود بازیهای تختهای که هوش مصنوعی در آن مهارت پیدا نکرده بود - و در بین بازیکنان انسانی ماهر و خبره، در نهایت به سه رده اول راه پیدا کرده است.
بررسیهای قبلی نشان دادهاند که هوش مصنوعی میتواند خود را برای یادگیری بازیهایی مانند شطرنج و «گو» (Go) از نقطه صفر آموزش دهد و حتی بر آن بازیها مسلط شود و بر رقبای انسانی پیروز شود.
با این حال، استراتگو چالشی را برای هوش مصنوعی ایجاد کرد، چرا که پیچیدهتر است و بر اطلاعات ناکامل اتکا دارد- و در آن بازیکنان نمیتوانند هویت مهرههای رقیب خود را مستقیما مشاهده کنند.
استراتگو یک بازی نوبتی براساس بلوف و تاکتیک است که شامل گردآوری اطلاعات و تدابیر زیرکانه است که در آن هر گونه عایدی یک بازیکن، به همان اندازه برای رقیبشان ضرر محسوب میشود.
محققان از جمله کارل تویلز از دیپمایند گوگل، میگویند ماهر شدن و تسلط یافتن برای هوش مصنوعی بهطور خاص چالشبرانگیز است، زیرا این بازی شامل تصمیمگیری بر اساس اطلاعات ناقص و ظرفیت بلوفزنی است.
دکتر تویلس، یکی از نویسندگان این مقاله از دیپمایند، توضیح داد: «برخلاف بازیهای تختهای معروف مانند شطرنج یا گو، بازیکنان در استراتگو نمیتوانند مستقیما هویت مهرههای حریف را مشاهده کنند، در نتیجه روشهای هوش مصنوعی که روی این قبیل بازیها مانند آلفازیرو بهخوبی کار میکردند – که بهشدت بر جستوجو متکی بودند – بهراحتی قابل انتقال به استراتگو نیستند.»
استراتگو بازی اطلاعات ناکامل است: بازیکنان نمیتوانند مستقیما مهرههای رقیب خود را مشاهده کنند.
این باعث میشود دیگر سامانههای مبتنی بر هوش مصنوعی نتوانند از سطح مبتدی فراتر بروند. همچنین به این معنی است که روش موفقی به نام «جستوجوی درخت بازی» به قدر کافی ارتقاپذیر نیست.
بازیکنان استراتژی و استدلال را بر روی یک سری اقدامهای پیدرپی به کار میبندند بدون اینکه شناخت روشنی در مورد این داشته باشند که چگونه هر یک از اینها در نتیجه نهایی نقش دارند.
دانشمندان توضیح دادند که آنها باید «همه نتایج ممکن را هنگام تصمیمگیری بسنجند و مقایسه کنند» و افزودند که تعداد حالتهای احتمالی - ده به توان ۵۳۵ - در مقایسه با شطرنج، گو و پوکر هم «فراتر و زیادتر از حد تصور» است.
این بازی، بهطور پیدرپی توانایی بازیکن را در تصمیمگیری نسبتا آرام، مبتنی بر تامل و منطقی آزمایش میکند.
محققان میگویند همه این عوامل، تسلط بر استراتگو را برای جامعه هوش مصنوعی دشوار کرده است.
دانشمندان در مطالعه جدیدی که هفته گذشته در ژورنال ساینس منتشر شد، از باتی به نام دیپنش گزارش دادند که در پیچیدهترین نوع این بازی، استراتگو کلاسیک، به عملکردی در سطح متخصص انسانی دست یافته است.
آنها دیپنش را در برابر پیشرفتهترین باتهای مختلف استراتگو و همچنین بازیکنان متخصص انسانی آزمایش کردند.
این بات در برابر تمام باتهایی که با آنها بازی کرد پیروز شد و به یک «سطح بازی بسیار رقابتی» در برابر بازیکنان متخصص انسانی استراتگو در «گراوُن» - یک پلتفرم بازی اینترنتی و بزرگترین پلتفرم (بستر) آنلاین برای استراتگو دست یافت.
دانشمندان میگویند که دیپنش یک «استراتژی غیرقابل پیشبینی» را برای پیروز شدن توسعه داد و اضافه میکنند که راهاندازی اولیه آن به شکل قابل توجهی تغییر کرده تا از این موضوع جلوگیری کند که حریفش طی یک سری از بازیها، الگوهای هوش مصنوعی را تشخیص دهد.
این مطالعه افزود کرد که بات هوش مصنوعی حتی یاد گرفت که با استفاده از مهرههای ضعیفتر بهطوری که انگار مهرههای رده بالاییاند، به حریف خود بلوف بزند.
وینسنت دی بوئر، یکی از نویسندگان این مقاله، طی سخنانی گفت: «سطح بازی دیپنش من را شگفتزده کرد. من هرگز درباره یک بازیکن مصنوعی استراتگو که در برابر یک بازیکن انسانی با تجربه، به سطح لازم برای پیروزی در یک مسابقه نزدیک شده بود، نشنیده بودم.»
او گفت: «اما پس از اینکه خودم در برابر دیپنش بازی کردم، از رتبه ۳ که بعدا در پلتفرم گراوُن به دست آورد، شگفتزده نشدم. من انتظار دارم که اگر اجازه شرکت در مسابقات جهانی انسانی را بیابد، بسیار عالی نتیجه بگیرد.»
دانشمندان باور داشتند که یافتههای این مطالعه میتواند به چند مشکل چندعاملی در دنیای واقعی منجر شود که با تعداد نجومی حالتها سروکار دارد و با اطلاعات ناقص و ناکاملی مشخص شود که در حال حاضر برای روشهای پیشرفته هوش مصنوعی دور از دسترس است.
پژوهشگران در این مقاله نوشتند: «کاربردهای بسیاری را میتوان در این دسته بزرگتر از بازیها یافت، از جمله مدلسازی جمعیت و ترافیک، شبکه هوشمند، طراحی حراج و مشکلات بازار.»