ايتنا - تشخیص صداها با دقت 92 درصد توسط هوش مصنوعی متن باز گوگل

وقتی یک نمونه صدا به فناوری هوش مصنوعی متن باز گوگل ارائه می‌شود، این فناوری صدای دریافتی را به چندین بخش تقسیم می‌کند تا بتواند آنها را با دقت بالا بفهمد و از طریق الگوریتم‌های یادگیری ماشین بین آنها تمییز ایجاد کند.
یک سیستم قوی تشخص صدا باید بتواند بخش‌های مختلف صحبت‌های افراد جدید را درک کند و به حافظه بسپارد.

به گزارش ایتنا از رایورز به نقل از ونچربیت، بخش پژوهش هوش مصنوعی گوگل در مورد این مدل، کارهای زیادی انجام داد و تلاش کرد که در این مدل پیشرفت‌هایی ایجاد کند.
در این مدل از یک اسپیکر هوشمند برای تمییز صداهای مختلف استفاده می‌شود. این اسپیکر می‌تواند کار خود را با دقت 92 درصد انجام دهد.

پژوهشگران بر این باور هستند که الگوریتم‌های اصلی این سیستم می‌توانند افت و خیرهای حاصل از صدا را بررسی کنند و این افت و خیزها را با یکدیگر مقایسه کنند.
جالب این است که در بسیاری از موارد این افت و خیزها اصلا شباهتی با یکدیگر ندارد و به همین خاطر شناسایی تفاوت بین صداها برای هوش مصنوعی کار چندان سختی نیست.

پژوهشگران گوگل اذعان داشتند که این اسپیکر جدید با رویکردی ریاضیاتی به واژه‌ها می‌نگرد و از طریق یک شبکه عصبی خاص و نوعی فناوری یادگیری ماشینی، صداهای ورودی را به صورت یک دنباله درمی‌آورد.
این سیستم امکان یادگیری دانش سطح بالا را برای خود فراهم می‌کند تا بتواند پیچیدگی‌های موجود در صداها را تشخیص دهد و مسائل پیش روی خود را حل کند.

از آنجا که تمامی اجزای این سیستم قابلیت یادگیری دارد، باید همواره اطلاعات جدید و صداهای جدیدی به این سیستم داده شود تا به تدریج منبع اطلاعاتی آن قوی شود و بتواند هر صدایی را تجزیه و تحلیل کند.
بر اساس گفته پژوهشگران، این سیستم همواره به‌روزرسانی می‌شود تا قابلیت‌های صوتی شگفت انگیزی به کاربر ارائه دهد.