ایتنا – در واقع تشخیص سخن یکی از حوزههایی است که دهههاست از سوی شرکتهای فناوری و مؤسسات تحقیقاتی مورد پیگیری قرار گرفته و مایکروسافت موفق شده در این زمینه به موفقیتهای چشمگیری دست پیدا کند.
به گزارش ایتنا از رایورز به نقل از techradar، گروهی که در مایکروسافت سرگرم کار روی فناوری تشخیص سخن است، به یکی از اهداف خود دست یافته است. گفته میشود این گروه سامانهای طراحی کرده که میتواند به خوبی انسانها، حرفها را درک کند.
گفتنی است «نرخ خطای واژه» برای این سامانه، تنها ۵.۹ درصد است که با انسانها برابری میکند. حتی با اینکه این سیستم بهطور کامل و بینقص حرفها را نمیشنود، اما دقت ۹۴ درصدی برای چنین سیستمی فراتر از انتظارهاست.
جفری زوایگ (یکی از پژوهشگران در این پروژه) در یک پست وبلاگی در مایکروسافت گفته است: «این موفقیت نتیجه بیش از بیست سال تلاش بوده است.»
تشخیص سخن یکی از حوزههایی است که دهههاست از سوی مؤسسات تحقیقاتی مورد پیگیری قرار گرفته است. با گذشت سالها، کیفیت این فناوری رو به بهبود بوده و تازهترین پیشرفتها در سایه شبکههای عصبی و یادگیری ماشین حاصل شدهاند.
زوایگ در ادامه مینویسد: «پیشرفت ما، نتیجه مهندسی دقیق و بهینهسازی شبکههای عصبی است. این نمونههای شنیداری میتوانند میزان بسیار زیادی از دادههای شنیداری را مدلسازی کنند.»
گفتنی است این گروه تا حد زیادی از مجموعه شبکه رایانشی منبعباز مایکروسافت با نام Computational Network Toolkit استفاده کرده است.
این فناوری بهطور طبیعی نوعی از بهترین حالت سنجش و اندازهگیری است. برای مثال، سامانه مذکور در محیطهای پر سر و صدا نمیتواند به خوبی ما انسانها صداها را بشنود و تشخیص دهد و ممکن است لهجهها هم روی آن تأثیرگذار باشند؛ هرچند که نهایتاً این مسائل قابل حل هستند و بنابراین مایکروسافت اذعان دارد دستاوردی که به آن میبالد، پایان راه نیست.