فیسبوک و راهاندازی دو مجموعه داده برای بهبود آنالیز ویدئو هوش مصنوعی
ایتنا- همانگونه که از نام این مجموعه داده مشخص است، موضوعاتی که در ویدئو مطرح میشود، به چیزی فراتر از انسانها مربوط میشود.
فیسبوک، با تازگی دو مجموعه داده باز جدید برای کمک به توسعهدهندگان و دانشمندان داده راهاندازی نمود که مسئله پرورش سیستمهای هوش مصنوعی برای درک بهتر ویدئوها را تسهیل مینماید.
مجموعه داده اس.اُ.اِی (صحنهها، اشیاء و اقدامات) با حجم عظیمی از ویدئوهای حاوی چندین برچسب، از توسعهدهندگان پشتیبانی میکند. این برچسبها نشان میدهد که چه مواردی در این ویدئوها مشاهده میشود و هر ویدئو توسط افراد برچسب میخورد.
گفتنی است این افراد آموزش میبینند تا برچسبها را به گونهای بچسبانند که محتوای فیلم را آنگونه که باید و شاید توصیف کنند. برچسبهای موردبحث را میتوان برای پرورش سیستمهای هوش مصنوعی هم مورد استفاده قرار داد.
به گزارش ایتنا از رایورز مجموعه داده جنریک موشنز شامل مجموعهای از گیفهاست که بر ویژگیهای حرکت خاص مانند پریدن و لغزیدن تمرکز دارند. همانگونه که از نام این مجموعه داده مشخص است، موضوعاتی که در ویدئو مطرح میشود، به چیزی فراتر از انسانها مربوط میشود و باید امکان استفاده از این دادهها برای آموزش یک ماشین در جهت درک حرکات مختلف مانند افتادن پاندا یا سُر خوردن گربه میسر باشد.
هر دو مجموعه داده میبایست برای ساخت سیستمهای فهم ویدئوی هوشمندتر با استفاده از یادگیری ماشینی، مفید باشد.
اس.اُ.اِی به ارتباط با سیستمهای یادگیری ماشینی کمک نموده و ویدئوهای زیربنایی را درک نمیکند، بلکه نوعی نشانگر مماسی برای آن انتخاب میکند.
مانوهار پالوری، مدیر پژوهش بینایی کامپیوتر فیسبوک، در کنفرانس گیتهاب یونیورس اذعان داشت که شبکه عصبی فرضی، درون ویدئو صرفاًبه دنبال وجود یک قایق میگردد و سپس در صورت وجود چنین چیزی، عبارت قایقرانی را روی آن درج میکند.
فیسبوک قصد دارد با استفاده از مجموعه داده اس.اُ.اِی، توسعهدهندگان و دانشمندان داده در سراسر جهان را با بهترین مدلها برای درک محتوای ویدئوها به چالش دعوت کند.
مجموعه دادههای باز استراتژیک، نقش مهمی را در پیشبرد مسئله یادگیری ماشینی ایفا نمودهاند. همچنین، ایمیجنت -که مجموعهای از تصاویر برچسبدار است- به معیاری کلیدی برای سیستمهای بینایی کامپیوتر تبدیل شده است.