ايتنا - رویارویی گوگل با اوپن ‌ای‌آی در زمین هوش مصنوعی

هوش مصنوعی به عرصه رقابتی جدیدی برای غول‌های تکنولوژی تبدیل شده و در این میان ظاهرا نبرد اصلی حالا میان گوگل و مایکروسافت به عنوان مالک اوپن ‌ای‌آی است. در ادامه تلاش‌های گوگل برای از میدان به در کردن اوپن‌ای‌آی و البته بعد از شکست چت‌بات هوش مصنوعی بارد این شرکت، هفته گذشته جمینای (Gemini) به عنوان قدرتمندترین مدل هوش مصنوعی گوگل رونمایی شد. این غول تکنولوژی در زمان معرفی جمینای، ویدئویی خیره‌کننده از عملکرد این هوش مصنوعی منتشر کرد که کمی بعد مشخص شد که این ویدئو واقعی نبوده است.

هدف گوگل از ارائه چنین مدلی، رقابت با ChatGPT-۴ بود که تاکنون پیشرفته‌ترین و موفق‌ترین مدل چت‌بات بوده و هیچ شرکتی نتوانسته مدلی اختصاصی را ارائه کند که بتواند با این هوش مصنوعی رقابت کند. گوگل اما ادعا کرد که مدل اولترا جمینای نسبت به چت جی‌پی‌تی عملکرد بهتری دارد.

البته گوگل قبل از معرفی جمینای از مدل هوش مصنوعی بارد رونمایی و اعلام کرده بود که این مدل توانایی رقابت با چت جی‌پی‌تی را دارد. با این همه اوضاع آن‌طور که این غول فناوری پیش‌بینی می‌کرد، پیش نرفت و با وجود تمام تلاش‌های گوگل، اوپن‌‌ای‌آی همچنان در دنیای هوش مصنوعی پیشتاز است تا سهم گوگل فعلا شکست باشد.

گوگل چهارشنبه هفته گذشته سرانجام پس از مدت‌ها انتظار از مدل هوش مصنوعی جدید خود به نام جمینای رونمایی کرد. این مدل به عنوان تواناترین و قدرتمندترین ابزار هوش مصنوعی این شرکت معرفی شد و گوگل اعلام کرد که با آن به جنگ با چت‌ جی‌پی‌تی شرکت اوپن‌ای‌آی می‌رود. بنابر اعلام مدیران گوگل، جمینای شامل سه سرویس عمده می‌شود.

نخستین سرویس «جمینای پرو» نام دارد که با ادغام در سرویس‌های هوش مصنوعی گوگل، در چت‌بات بارد به کار خواهد رفت تا به شکل متنی و در قالب مکالمه به نیازهای کاربران پاسخ دهد. سرویس دوم به اسم «جمینای نانو» شناخته می‌شود که برای تلفن‌های همراه و توسعه‌دهندگان اندرویدی از جمله گوشی‌های پیکسل ۸ پرو ساخته شده است. سرویس آخر «جمینای اولترا» نام گرفته که قدرتمندترین مدل زبانی بزرگ خلق‌شده توسط گوگل تا کنون به شمار می‌رود.

مقامات گوگل می‌گویند قرار است جمینای اولترا در اوایل سال آینده میلادی در چت‌بات مکالمه‌محور بارد ادغام شود.به نظر می‌رسد گوگل امیدوار است که به این وسیله، بارد بتواند از چت‌جی‌پی‌تی مایکروسافت در هوش مصنوعی پیشی بگیرد.

در همین راستا ساندار پیچای، مدیر اجرایی آلفابت شرکت مادر گوگل، روز چهارشنبه گذشته در یک پست وبلاگی نوشت: «جمینای نتیجه تلاش‌های مشترک در مقیاس بزرگ توسط تیم‌های

شواهد نشان می‌دهد که در همین ابتدای کار گوگل به در بسته خورده است؛ چون مشخص شد ویدئوی هیجان‌انگیزی که برای نمایش ویژگی‌‎های هوش مصنوعی جمینای منتشر کرده بود، واقعی نیست. به گزارش بلومبرگ، این غول فناوری عملکرد جمینای را در ویدئو اشتباه نشان داده است.

سراسر گوگل، از جمله همکاران ما در واحد تحقیقات گوگل است. این سرویس از ابتدا برای چند بعدی بودن ساخته شده است؛ به این معنی که می‌تواند موضوع را تعمیم دهد، به‌طور یکپارچه درک کرده و انواع مختلف اطلاعات از جمله متن، کد، صدا، تصویر و ویدئو را با هم ترکیب کند.»

مدیران اجرایی گوگل گفته‌اند جمینای پرو از چت جی‌پی‌تی نسخه ۳.۵ بهتر عمل می‌کند. با این حال آنها درباره عملکرد سرویس جدید خود در مقایسه با الگوی هوش مصنوعی جی‌پی‌تی‌۴ هیچ اظهارنظری نکرده‌اند. با این همه دمیس هاسابیس، مدیرعامل دیپ‌مایند که در خلق جمینای نقش داشته است، اظهار کرد که جمینای اولترا در ۳۰ مورد از ۳۲ مورد آزمون معیار، بهتر از چت جی‌پی‌تی۴ عمل کرده است.

با این همه شواهد نشان می‌دهد که در همین ابتدای کار گوگل به در بسته خورده است؛ چون مشخص شد ویدئوی هیجان‌انگیزی که برای نمایش ویژگی‌‎های هوش مصنوعی جمینای منتشر کرده بود، واقعی نیست. به گزارش بلومبرگ، این غول فناوری عملکرد جمینای را در ویدئو اشتباه نشان داده است.

در ویدئویی که گوگل منتشر کرده است، هوش مصنوعی جمینای می‌تواند آنچه کاربر با دست‌های خود انجام می‌دهد، تشخیص دهد و به دستورهای صوتی پاسخ دهد. به گفته بلومبرگ، در این ویدئو جمینای بیش از حد توانمند نشان داده شده است.

ویدئوی ۶ دقیقه‌ای گوگل، قابلیت‌های Multimodal جمینای (برای مثال دستورهای گفتاری با قابلیت تشخیص تصویر) را نشان می‌دهد. در این ویدئو جمینای ظاهرا تصاویر را تشخیص می‌دهد و به سرعت به سوالات پاسخ می‌دهد. با این همه بنابر گزارش بلومبرگ، گوگل اعتراف کرده است که اتفاقات ویدئو همراه با پرامپت‌های صوتی در لحظه رخ نداده‌ است.

از طرفی کاربران با تماشای ویدئو تصور می‌کنند که یک کاربر در حال مکالمه با جمینای است و هوش مصنوعی گوگل در لحظه به صحبت‌ها پاسخ می‌دهد، در حالی‌ که در واقعیت چنین اتفاقاتی رخ نداده‌ است. طبق ادعای خبرنگار بلومبرگ، گوگل برای پنهان‌ کردن این موضوع که جمینای از چت‌بات چت‌ جی‌پی‌تی شرکت اوپن‌ای‌آی عملکرد ضعیف‌تری دارد، تصمیم به انتشار چنین ویدئویی گرفته است. البته گوگل چنین موضوعی را رد کرده است.

اوریول وینیالز، معاون ریاست بخش تحقیق و یادگیری عمیق دیپ‌مایند که یکی از رهبران پروژه جمینای هم محسوب می‌شود، با انتشار پستی در ایکس نحوه ساخت ویدئو را چنین توضیح داده است: «تمام دستورها و خروجی‌ها در ویدئو واقعی هستند و برای اختصار، کوتاه شده‌اند. این ویدئو نشان‌دهنده تجربه کاربری است که افراد می‌توانند با جمینای داشته باشند. ما این ویدئو را برای الهام‌بخشیدن به توسعه‌دهندگان ساخته‌ایم.»

گوگل در مدت اخیر بارها تلاش کرده است تا با ساخت مدل‌های مختلف هوش مصنوعی به جنگ با اوپن‌ای‌آی برود. این غول دنیای فناوری ابتدا با ساخت هوش مصنوعی بارد شانس خود را امتحان کرد و پس از آنکه به نتیجه مطلوبی نرسید، به مدل جدیدترش پناه برد که خودش آن را قدرتمندترین مدل هوش مصنوعی می‌نامد. با این همه باید تا زمانی که نسخه بتای جمینای در اختیار کاربران قرار می‌گیرد، منتظر ماند و دید که آیا جمینای قابلیت رقابت دارد یا خیر.

منبع: روزنامه دنیای اقتصاد