ايتنا - تقلید دقیق هوش مصنوعی گوگل از صدای انسان‌ها

فناوری هوش مصنوعی گوگل موسوم به DeepMind گام بلندی رو به جلو برداشته و توانسته با دقتی بی‌سابقه برخی اصوات و مکالمات انسانی را درک و دقیقا از آنها تقلید کند.

به گزارش ایتنا از فارس، فناوری مذکوری از سیستمی موسوم به WaveNet برای تولید صدا از طریق نمونه‌برداری از صدای واقعی انسان و مدل‌سازی امواج صوتی استفاده می‌کند.

اصوات انسانی آزمایشی تولید شده به این شیوه به زبان‌های چینی و انگلیسی نشان می‌دهد که هوش مصنوعی گوگل از پخش ماشینی صدای انسان بسیار فراتر رفته و توانسته صدای افراد مختلف را با دقت و با توجه به ویژگی‌های خاص موجود در صدای آنها بازسازی و تقلید کند. اگر چه اصوات طراحی شده هنوز تفاوت‌هایی با اصوات واقعی انسان‌ها دارند.

برنامه‌های تبدیل متن به صوت و تقلید صدای انسان در دنیای رایانه از اهمیت بسیاری زیادی برخوردارند، زیرا در تولید برنامه‌های دستیار صوتی و دیگر برنامه‌های مبتنی بر هوش مصنوعی کاربرد دارند. این برنامه ها در نرم‌افزارهایی مانند سیری، کورتانا ، آلکسا و Google Assistant مورد استفاده قرار گرفته‌اند.

در حال حاضر اگر سوالی از طریق این نرم‌افزارها مطرح شود، صدایی ضبط شده و مصنوعی با تبدیل متن پاسخ به صدا به کاربر پاسخ می‌دهد، اما فناوری‌های جدید ابداع انواع صداهای طبیعی و انسانی با تن‌ها و لهجه‌های مختلف را ممکن می‌کند.

سیستم جدید گوگل مبتنی بر ورود صدای واقعی است، اما می‌تواند با یادگیری ویژگی‌های صوت دریافتی به طور مستقل صدایی مشابه با آن را با کلماتی جدید خلق کرده و پخش نماید. البته WaveNet فعلا تنها قادر به درک ویژگی‌های صوت و نه محتوای صحبت‌های فرد است ولی قرار است درک آن در این زمینه نیز ارتقا یابد.