ایتنا - هوش مصنوعی گوگل با نام «جمینای» ادعا کرده که از همه نمونهها بهتر است، اما آیا چنین حرفی درست است؟
پردهبرداری از «جمینای» توسط گوگل، یک مدل هوش مصنوعی که برای از بین بردن شکاف بین غول موتورهای جستوجو و OpenAI ساخته شده است، توجهها را جلب کرد. بنچمارک قوی، نسخه نمایشی ویدیویی پر زرق و برق و در دسترس بودن (هرچند برای یک نسخه کات بک) بسیار امیدوارکننده بود.
اما وقتی مهندسان و علاقهمندان به هوش مصنوعی جزئیات را بررسی کردند و ایراداتی پیدا کردند، این رویکرد مثبت از بین رفت. جمینای تازهواردی است که امکان دارد در نهایت سلطه GPT-4 را از بین ببرد، اما رفتار محتاطانه گوگل باعث شده است که آنها دفاعی بازی کنند.
مشکلات نسخه دموی گوگل
نسخه دموی جمینای گوگل انتقاداتی را بهدنبال داشته است و توسعهدهندگان هوش مصنوعی متوجه ناهماهنگیهایی شدند. دموی مورد بحث «Hands-on with Gemini» نام دارد و در کنار نمایش جمینای در یوتیوب راهاندازی شده است. سریع، دوستانه، سرگرمکننده و مملو از نمونههای بصری قابل درک است.
یکی از نمایندگان گوگل میگوید این نسخه نمایشی «اعلانها و خروجیهای واقعی جمینای را نشان میدهد». اما ویرایش ویدیو برخی از جزئیات را حذف میکند. تبادل با جمینای از طریق متن انجام شد، نه صدا، و مشکلات بصری که هوش مصنوعی حل کرد، بهعنوان ورودی تصویر بود، نه یک فید ویدیوی زنده. وبلاگ گوگل همچنین درخواستهایی را که در نسخه نمایشی نشان داده نمیشوند، توضیح میدهد. هنگامی که از جمینای خواسته شد تا یک بازی سنگ، کاغذ، قیچی را بر اساس حرکات دست شناسایی کند، به او گفته شد که «این یک بازی است». اما نسخه دمو آن اشاره را حذف میکند.
این تازه شروع مشکلات گوگل است. توسعهدهندگان هوش مصنوعی به سرعت متوجه شدند که قابلیتهای جمینای کمتر از آنچه در ابتدا بهنظر میرسید انقلابی و پیشرو است. اگر به قابلیتهای GPT-4 Vision نگاه کنید و رابط مناسبی برای آن بسازید، شبیه جمینای میشود.
در ۱۱ دسامبر، تنها پنج روز پس از پردهبرداری از جمینای، یک توسعهدهنده هوش مصنوعی به نام گرگ سادتسکی، نسخه دموی جمینای را با GPT-4 Vision تولید کرد.
جمینای اولترا، بزرگترین مدل از سه مدل این خانواده، ادعا میکند که GPT-4 را در موارد مختلف شکست میدهد. گوگل برای اندازه گیری عملکرد جمینای از روش های متفاوتی نسبت به سایرین استفاده کرد. روشی که کاربر از یک مدل هوش مصنوعی درخواست میکند میتواند بر عملکرد آن تاثیر بگذارد و نتایج فقط زمانی قابل مقایسه هستند که از استراتژی یکسان و سریع استفاده شود.
مقاله گوگل در مورد جمینای طیف وسیعی از مقایسهها را ارائه میدهد، اما تیم بازاریابی آن استراتژیهای مختلف را مقایسه میکند تا نتایج خود را بهتر نشان دهد. همچنین کاملا روی جمینای اولترا تمرکز دارد که هنوز در دسترس عموم قرار نگرفته است. جمینای پرو، تنها نسخه موجود در حال حاضر، نتایج کمتر قابل توجهی را ارائه میدهد.
البته اگربازاریابی غیر صادقانه را کنار بگذاریم، جمینای یک شاهکار چشمگیر است.
مشکلات ارائه Gemini بر اعلام آن سایه انداخته است. با این حال، بازاریابی غیر صادقانه را پشت سر بگذارید و Gemini همچنان یک شاهکار چشمگیر است. سرنوشت جمینای هنوز مشخص نیست و به دتاریخ انتشار جمینای اولترا و GPT-5 OpenAI بستگی دارد.
در حالی که کاربران در حال حاضر میتوانند جمینای پرو را امتحان کنند، برادر بزرگتر آن تا سال ۲۰۲۴ منتشر نخواهد شد. سرعت سریع توسعه هوش مصنوعی باعث میشود که نتوان گفت که اولترا پس از ورود چگونه خواهد بود، و به OpenAI زمان کافی برای پاسخگویی با یک نسخه جیپیتی جدید میدهد.