ایتنا- دانشمندان علوم کامپیوتر در دانشگاه MIT سیستمی را طراحی کردند که تمامی اشیاء درون یک عکس را شناسایی میکند و نام آنها را به صورت صوتی بیان میکند. این سیستم میتواند پس از مشاهده عکس، تمامی موارد را با سرعت بیان کند.
دانشمندان علوم کامپیوتر دانشگاه صنعتی ماساچوست یا به اختصار “MIT” سیستمی را طراحی کردند که میتواند تمامی اشیاء و وسایلی که در یک تصویر وجود دارد را شناسایی کند و با استفاده سیستم سخنگویی که در این سیستم تعبیه شده است میتواند نام ابزار و وسایل مورد نظر خود را به زبان بیاورد.
به گزارش ایتنا از رایورز به نقل از روبوهاب، در حال حاضر سیستمهای مشابه با این سیستم ارائه شده است ولی تفاوتی که سیستم پیش رو با سیستمهای موجود دارد، این است که هیچ نیازی به نمایش نمونه و مثال ندارد.
این سیستم با استفاده از کلیپهای ضبط شده و تصاویر موجود در عکس، نام آن وسیله را یاد میگیرد و به حافظه میسپارد.
این مدل در حال حاضر میتواند چند صد لغت مختلف و وسیله مختلف را شناسایی و بیان نماید.
پژوهشگران تصمیم دارند که این تکنیک شناسایی اشیاء با سیستم سخنگو را به شکلی راهاندازی کنند که بتواندد چندین ساعت کار را ذخیره کند و سپس درهای جدیدی را در راستای فناوری گفتار و تصویر به کاربران ارائه دهد.
سیستمهای شناسایی گفتاری موجود مانند سیری و گوگل ویس، نیاز به چندین ساعت ضبط صدا دارند. سیستمهای فعلی با استفاده از مرکز داده خود، آموزش میبینند که سیگنالهای گفتاری را با کلمات خاص مطابقت دهد.
البته این روش وقتی مشکل پیدا میکند که کلمه جدیدی به مجموعه اضافه شود. حتی اگر قرار باشد یک کلمه جدید اضافه شود، سیستم باید مجددا اصلاح شود و آموزش بیند.
دیوید هارواث، دانشمند علوم کامپیوتر، اذعان داشت: «ما میخواهیم با استفاده از سیستم جدید شناسایی گفتاری، ارائه اطلاعات به کاربران را به شکلی طبیعی انجام دهیم. الگوریتمهای یادگیری ماشین میتوانند در این زمینه بسیار مفید و کارآمد باشد.»