تشخیص صداها با دقت 92 درصد توسط هوش مصنوعی متن باز گوگل
ایتنا- فناوری هوش مصنوعی متن باز گوگل این امکان را دارد که صداهایی که دریافت میکند را با دقت 92 درصدی از هم تمییز دهد. این کار از طریق برش صداها به بخشهای مختلف و مقایسه آنها صورت میگیرد.
وقتی یک نمونه صدا به فناوری هوش مصنوعی متن باز گوگل ارائه میشود، این فناوری صدای دریافتی را به چندین بخش تقسیم میکند تا بتواند آنها را با دقت بالا بفهمد و از طریق الگوریتمهای یادگیری ماشین بین آنها تمییز ایجاد کند.
یک سیستم قوی تشخص صدا باید بتواند بخشهای مختلف صحبتهای افراد جدید را درک کند و به حافظه بسپارد.
به گزارش ایتنا از رایورز به نقل از ونچربیت، بخش پژوهش هوش مصنوعی گوگل در مورد این مدل، کارهای زیادی انجام داد و تلاش کرد که در این مدل پیشرفتهایی ایجاد کند.
در این مدل از یک اسپیکر هوشمند برای تمییز صداهای مختلف استفاده میشود. این اسپیکر میتواند کار خود را با دقت 92 درصد انجام دهد.
پژوهشگران بر این باور هستند که الگوریتمهای اصلی این سیستم میتوانند افت و خیرهای حاصل از صدا را بررسی کنند و این افت و خیزها را با یکدیگر مقایسه کنند.
جالب این است که در بسیاری از موارد این افت و خیزها اصلا شباهتی با یکدیگر ندارد و به همین خاطر شناسایی تفاوت بین صداها برای هوش مصنوعی کار چندان سختی نیست.
پژوهشگران گوگل اذعان داشتند که این اسپیکر جدید با رویکردی ریاضیاتی به واژهها مینگرد و از طریق یک شبکه عصبی خاص و نوعی فناوری یادگیری ماشینی، صداهای ورودی را به صورت یک دنباله درمیآورد.
این سیستم امکان یادگیری دانش سطح بالا را برای خود فراهم میکند تا بتواند پیچیدگیهای موجود در صداها را تشخیص دهد و مسائل پیش روی خود را حل کند.
از آنجا که تمامی اجزای این سیستم قابلیت یادگیری دارد، باید همواره اطلاعات جدید و صداهای جدیدی به این سیستم داده شود تا به تدریج منبع اطلاعاتی آن قوی شود و بتواند هر صدایی را تجزیه و تحلیل کند.
بر اساس گفته پژوهشگران، این سیستم همواره بهروزرسانی میشود تا قابلیتهای صوتی شگفت انگیزی به کاربر ارائه دهد.