ایتنا - هفته گذشته، شرکت اُپنایآی (OpenAI) یک مدل هوش مصنوعی جدید به نام سورا (Sora) منتشر کرد که میتواند کلیپهای ویدیویی با وضوح بالا از پیامهای متنی تولید کند. اما همه آنها اساسا فیلمهای صامت بودند. اکنون شرکت ایلوِنلبز(ElevenLabs) صدای پس زمینه را به فیلمهای ساخته شده توسط سورا اضافه کرده است.
هفته گذشته، شرکت اُپنایآی (OpenAI) یک مدل هوش مصنوعی جدید به نام سورا (Sora) منتشر کرد که میتواند کلیپهای ویدیویی با وضوح بالا از پیامهای متنی تولید کند. اما همه آنها اساسا فیلمهای صامت بودند. اکنون شرکت ایلوِنلبز(ElevenLabs) صدای پس زمینه را به فیلمهای ساخته شده توسط سورا اضافه کرده است.
به گزارش ایتنا از ایسنا، استارتاپ شبیهسازی صدای هوش مصنوعی ایلونلبز توسط پیوتر دابکوفسکی(Piotr Dabkowski) مهندس پیشین یادگیری ماشینی گوگل و متی استانیسزوسکی(Mati Staniszewski) استراتژیست سابق در سال ۲۰۲۲ تاسیس شد و از آن زمان نرمافزار تبدیل متن به گفتار و ابزار دوبله هوش مصنوعی را توسعه داده است که به طور خودکار گفتار در یک فیلم را به بیش از ۲۰ زبان که لحن و سبک صدای اصلی را حفظ میکنند، تبدیل میکند.
اکنون این شرکت روی چیز جدیدی کار میکند، که طبق گزارشها میتواند صداهایی را برای همراهی با فیلمهای ویدئویی بیصدا بر اساس توضیحات یک صحنه ارائه شده توسط کاربر ایجاد کند.
ایلونلبز برای نشان دادن مهارت خود آن را روی برخی از محتوای تولید شده توسط سورا منتشر کرده است.
این شرکت توضیح میدهد: ما از پیامهای متنی مانند «برخورد امواج»، «صدای برخورد فلزات»، «صدای پرندگان» و «موتور ماشین مسابقهای» برای تولید صدا استفاده کردیم که روی برخی از کلیپهای مورد علاقهمان از اعلان سورا قرار دادیم.
نسخه نمایشی مجموعهای از کلیپهای ویدیویی تولید شده توسط سورا را به همراه صداهای پسزمینه نسبتا واقعی نشان میدهد که متشکل از صدای قدم زدن در خیابان شلوغ همراه با زمزمه شهر گرفته تا صدای بوقها و پهپاد مکانیکی ربات دوپا تا روایتی شبیه فیلم با صدای تبلیغاتی به سبک هالیوود میشود. همه اینها ظاهرا از روی پیامهای متنی به صوت تبدیل شده است.
مشابه هوش مصنوعی سورا، بیشک مشکلاتی وجود خواهد داشت که نیاز به کار دارند، و همچنین محافظت در برابر تقلب و پروتکلهای ایمنی نیز وجود دارد اما با سرعت توسعه هوش مصنوعی، آیا میتوان انتظار داشت که در آینده نزدیک اسکار بهترینها به هوش مصنوعی اعطا شود؟
هنوز هیچ اطلاعاتی در مورد اینکه چه زمانی میتوانیم انتظار داشته باشیم فناوری جلوههای صوتی وارد بازار شود، منتشر نشده است، اما از افرادی که علاقهمند به یادگیری بیشتر در مورد آن هستند دعوت میشود تا ثبت نام کنند.