ایتنا - هوش مصنوعی گوگل از صدای روباتی انسانها فراتر رفته و میتواند صدای دقیق انسانها با تنها و لهجههای مختلف را تقلید کند.
فناوری هوش مصنوعی گوگل موسوم به DeepMind گام بلندی رو به جلو برداشته و توانسته با دقتی بیسابقه برخی اصوات و مکالمات انسانی را درک و دقیقا از آنها تقلید کند.
به گزارش ایتنا از فارس، فناوری مذکوری از سیستمی موسوم به WaveNet برای تولید صدا از طریق نمونهبرداری از صدای واقعی انسان و مدلسازی امواج صوتی استفاده میکند.
اصوات انسانی آزمایشی تولید شده به این شیوه به زبانهای چینی و انگلیسی نشان میدهد که هوش مصنوعی گوگل از پخش ماشینی صدای انسان بسیار فراتر رفته و توانسته صدای افراد مختلف را با دقت و با توجه به ویژگیهای خاص موجود در صدای آنها بازسازی و تقلید کند. اگر چه اصوات طراحی شده هنوز تفاوتهایی با اصوات واقعی انسانها دارند.
برنامههای تبدیل متن به صوت و تقلید صدای انسان در دنیای رایانه از اهمیت بسیاری زیادی برخوردارند، زیرا در تولید برنامههای دستیار صوتی و دیگر برنامههای مبتنی بر هوش مصنوعی کاربرد دارند. این برنامه ها در نرمافزارهایی مانند سیری، کورتانا ، آلکسا و Google Assistant مورد استفاده قرار گرفتهاند.
در حال حاضر اگر سوالی از طریق این نرمافزارها مطرح شود، صدایی ضبط شده و مصنوعی با تبدیل متن پاسخ به صدا به کاربر پاسخ میدهد، اما فناوریهای جدید ابداع انواع صداهای طبیعی و انسانی با تنها و لهجههای مختلف را ممکن میکند.
سیستم جدید گوگل مبتنی بر ورود صدای واقعی است، اما میتواند با یادگیری ویژگیهای صوت دریافتی به طور مستقل صدایی مشابه با آن را با کلماتی جدید خلق کرده و پخش نماید. البته WaveNet فعلا تنها قادر به درک ویژگیهای صوت و نه محتوای صحبتهای فرد است ولی قرار است درک آن در این زمینه نیز ارتقا یابد.