چتجیپیتی اکنون صحبت میکند، گوش میدهد و میفهمد
ایتنا - این قابلیتهای صوتی و تصویری جدید اختصاصاٌ برای مشترکین ChatGPT Plus با قیمت 20 دلار در ماه خواهد بود، و بر ارائه قابلیتهای پیشرفته به کاربران اختصاصی تمرکز دارد.
شرکت OpenAI در حال افزودن قابلیتهای پیشگامانهای به ChatGPT است که به آن امکان میدهد با استفاده هوش مصنوعی برای توانائیهای دیدن، شنیدن و صحبت کردن از موانع عبور کند.
قرار است در ظرف دو هفته آینده چندوجهیبودن و ارتقاهایی در تعامل با کاربر ارائه شوند، که یک جهش قابل توجه از تعاملات مبتنی بر متن به شمار میرود.
در این مطلب ایتنا و به نقل از هکرنون به بررسی قابلیتهای آن میپردازیم.
1. تعامل صوتی:
برای اولین بار، ChatGPT به درخواستهای کاربر به صورت شفاهی پاسخ میدهد، و آن را به یک شریک گفتوگوی تعاملیتر و جذابتر تبدیل میکند. این ویژگی در iOS و اندروید در دسترس خواهد بود و کاربران میتوانند از صدا برای انجام مکالمات متقابل با هوش مصنوعی استفاده کنند.
این قابلیت، ChatGPT را در رقابت مستقیم با دستیارهای صوتی مشهور مانند سیری و الکسا قرار میدهد.
2. تعامل چندوجهی ارتقایافته:
کاربران اکنون میتوانند تصاویر را به ChatGPT نشان دهند و در مورد آنها مکالمههای زنده داشته باشند، که امکان تجربه کاربری بصریتر و غنیتر را فراهم میکند. این ویژگی گامی قابل توجه در ارائه زمینه (کانتکست) بیشتر در طول تعاملات است و در همه پلتفرمها وجود دارد.
3. شخصیتهای مصنوعی سفارشیسازیشده:
پنج شخصیت مصنوعی خنثی از جمله Juniper، Breeze و Ember به صورت شفاهی به سوالات کاربران پاسخ خواهند داد. در نهایت، OpenAI قصد دارد به کاربران امکان دهد که صدای شخصی خود را ایجاد کنند که این کار باعث گسترش تجربیات کاربری میشود.
4. موتور Whisper پیشرفته:
موتور پیشرفته ویسپر کیفیت صداهای هوش مصنوعی را تقویت میکند، که با وجود داشتن سبکی که ممکن است برخی آن را نوعی فضولی و مزاحمت بدانند، اما اولین واکنشها به آن از جنبه تعامل انسانمانند مثبت بوده است.
5. دسترسی مبتنی بر اشتراک:
این قابلیتهای صوتی و تصویری جدید اختصاصاٌ برای مشترکین ChatGPT Plus با قیمت 20 دلار در ماه خواهد بود، و بر ارائه قابلیتهای پیشرفته به کاربران اختصاصی تمرکز دارد.
6. رسیدگی به دغدغههای اخلاقی:
شرکت OpenAI مطمئن است که اکثر باگهای آن را حل کرده است و روی پرداختن به مسائل ایدئولوژیک، از جمله تقلب صوتی بالقوه، تبعیض علیه لهجههای غیرمعمول، و نسبت دادن ناخواسته بار اجتماعی و سیاسی به صدای هوش مصنوعی تمرکز دارد. آنها اطمینان میدهند که قابلیت ناشناسکردن افراد از طریق عکسها در ChatGPT مسدود شده است.
7. کاربردهای جدید:
چندمنظورگی آن نیز افزایش یافته است، به طوری که به عنوان مثال کاربران میتوانند از مکانهای دیدنی یا محتویات یخچالشان عکس بگیرند و به صورت بیدرنگ درباره آنها گفتوگو کنند، که این ویژگی در سناریوهای مختلفی مانند سفر، آشپزی یا یادگیری میتواند مفید واقع شود.