ايتنا - آیا جمینای گوگل همه‌چیز تمام است؟

پرده‌برداری از «جمینای» توسط گوگل، یک مدل هوش مصنوعی که برای از بین بردن شکاف بین غول موتورهای جست‌وجو و OpenAI ساخته شده است، توجه‌ها را جلب کرد. بنچ‌مارک قوی، نسخه نمایشی ویدیویی پر زرق و برق و در دسترس بودن (هرچند برای یک نسخه کات بک) بسیار امیدوارکننده بود.
اما وقتی مهندسان و علاقه‌مندان به هوش مصنوعی جزئیات را بررسی کردند و ایراداتی پیدا کردند، این رویکرد مثبت از بین رفت. جمینای تازه‌واردی است که امکان دارد در نهایت سلطه GPT-4 را از بین ببرد، اما رفتار محتاطانه گوگل باعث شده است که آنها دفاعی بازی کنند.

مشکلات نسخه دموی گوگل
نسخه دموی جمینای گوگل انتقاداتی را به‌دنبال داشته است و توسعه‌دهندگان هوش مصنوعی متوجه ناهماهنگی‌هایی شدند. دموی مورد بحث «Hands-on with Gemini» نام دارد و در کنار نمایش جمینای در یوتیوب راه‌اندازی شده است. سریع، دوستانه، سرگرم‌کننده و مملو از نمونه‌های بصری قابل درک است.

یکی از نمایندگان گوگل می‌گوید این نسخه نمایشی «اعلان‌ها و خروجی‌های واقعی جمینای را نشان می‌دهد». اما ویرایش ویدیو برخی از جزئیات را حذف می‌کند. تبادل با جمینای از طریق متن انجام شد، نه صدا، و مشکلات بصری که هوش مصنوعی حل کرد، به‌عنوان ورودی تصویر بود، نه یک فید ویدیوی زنده. وبلاگ گوگل همچنین درخواست‌هایی را که در نسخه نمایشی نشان داده نمی‌شوند، توضیح می‌دهد. هنگامی که از جمینای خواسته شد تا یک بازی سنگ، کاغذ، قیچی را بر اساس حرکات دست شناسایی کند، به او گفته شد که «این یک بازی است». اما نسخه دمو آن اشاره را حذف می‌کند.

این تازه شروع مشکلات گوگل است. توسعه‌دهندگان هوش مصنوعی به سرعت متوجه شدند که قابلیت‌های جمینای کمتر از آنچه در ابتدا به‌نظر می‌رسید انقلابی و پیشرو است. اگر به قابلیت‌های GPT-4 Vision نگاه کنید و رابط مناسبی برای آن بسازید، شبیه جمینای می‌شود.

در ۱۱ دسامبر، تنها پنج روز پس از پرده‌برداری از جمینای، یک توسعه‌دهنده هوش مصنوعی به نام گرگ سادتسکی، نسخه دموی جمینای را با GPT-4 Vision تولید کرد.

جمینای اولترا، بزرگ‌ترین مدل از سه مدل این خانواده، ادعا می‌کند که GPT-4 را در موارد مختلف شکست می‌دهد. گوگل برای اندازه گیری عملکرد جمینای از روش های متفاوتی نسبت به سایرین استفاده کرد. روشی که کاربر از یک مدل هوش مصنوعی درخواست می‌کند می‌تواند بر عملکرد آن تاثیر بگذارد و نتایج فقط زمانی قابل مقایسه هستند که از استراتژی یکسان و سریع استفاده شود.

مقاله گوگل در مورد جمینای طیف وسیعی از مقایسه‌ها را ارائه می‌دهد، اما تیم بازاریابی آن استراتژی‌های مختلف را مقایسه می‌کند تا نتایج خود را بهتر نشان دهد. همچنین کاملا روی جمینای اولترا تمرکز دارد که هنوز در دسترس عموم قرار نگرفته است. جمینای پرو، تنها نسخه موجود در حال حاضر، نتایج کمتر قابل توجهی را ارائه می‌دهد.

البته اگربازاریابی غیر صادقانه را کنار بگذاریم، جمینای یک شاهکار چشم‌گیر است.

مشکلات ارائه Gemini بر اعلام آن سایه انداخته است. با این حال، بازاریابی غیر صادقانه را پشت سر بگذارید و Gemini همچنان یک شاهکار چشمگیر است. سرنوشت جمینای هنوز مشخص نیست و به دتاریخ انتشار جمینای اولترا و GPT-5 OpenAI بستگی دارد.

در حالی که کاربران در حال حاضر می‌توانند جمینای پرو را امتحان کنند، برادر بزرگتر آن تا سال ۲۰۲۴ منتشر نخواهد شد. سرعت سریع توسعه هوش مصنوعی باعث می‌شود که نتوان گفت که اولترا پس از ورود چگونه خواهد بود، و به OpenAI زمان کافی برای پاسخگویی با یک نسخه جی‌پی‌تی جدید می‌دهد.

منبع: همشهری آنلاین