ایتنا - شرکتهایی مانند Runway و Pika مدلهای تبدیلگر متن به ویدیوی تحسینبرانگیز تولیدی خود را معرفی کردند و لومیِر گوگل نیز یکی از رقبای اصلی OpenAI در این فضا به شمار میرود.
سورا مدل هوش مصنوعی تبدیل متن به ویدیوی اپنایآی رونمایی شد + ویدیو
سايت خبری ايتنا , 1 اسفند 1402 ساعت 5:19
ایتنا - شرکتهایی مانند Runway و Pika مدلهای تبدیلگر متن به ویدیوی تحسینبرانگیز تولیدی خود را معرفی کردند و لومیِر گوگل نیز یکی از رقبای اصلی OpenAI در این فضا به شمار میرود.
شرکت OpenAI از قصد خود برای عرضه یک مدل جدید برای تولید ویدئو به نام سورا (Sora) خبر داد.
به گزارش ایتنا و به نقل از ورج، این شرکت هوش مصنوعی میگوید سورا «میتواند صحنههای واقعی و تخیلی را از دستورالعملهای متنی خلق کند». این مدل تبدیلگر متن به ویدیو برای کاربران این امکان را فراهم میآورد تا ویدیوهای واقعگرایانه، با طول حداکثر یک دقیقه، ایجاد کنند - همه بر اساس دستورالعملهایی که برای آن نوشتهاند.
OpenAI در معرفی این مدل توضیح داده است که سورا قادر است «صحنههای پیچیده با کاراکترهای متعدد، انواع خاصی از حرکتها، و جزئیات دقیق سوژه و پسزمینه» ایجاد کند. این شرکت همچنین خاطرنشان کرده است که این مدل میتواند درک کند که چگونه اجسام «در دنیای فیزیکی وجود دارند»، و همچنین «بهطور دقیق درخواست کاربر را تفسیر میکند و کاراکترهای قانعکنندهای میآفریند که از نظر احساسی سرزنده هستند».
این مدل همچنین میتواند یک ویدیو بر اساس یک تصویر ثابت تولید کند، همچنین فریمهای از دست رفته را در یک ویدیوی موجود پر کرده یا آن را گسترش دهد. دموهای تولید شده توسط سورا که در پست وبلاگ OpenAI گنجانده شدهاند، شامل صحنهای هوایی از کالیفرنیا در عصر جویندگان طلا، ویدیویی که به نظر میرسد از داخل یک قطار توکیو گرفته شده است، و موارد دیگر میشود. بسیاری از آنها نشانههای آشکاری از تولید شدن توسط هوش مصنوعی دارند - مانند یک طبقه در یک ویدیو از یک موزه که به طرز مشکوکی متحرک است - و OpenAI میگوید این مدل «ممکن است با شبیهسازی دقیق فیزیک یک صحنه پیچیده مشکل داشته باشد»، اما نتایج در کل بسیار چشمگیر هستند.
کد مطلب: 77367
آدرس مطلب: https://www.itna.ir/news/77367/سورا-مدل-هوش-مصنوعی-تبدیل-متن-ویدیوی-اپن-ای-آی-رونمایی-ویدیو