ایتنا - تاکنون، شرکتهای هوش مصنوعی درباره دادههای مورد استفاده برای آموزش مدلهای خود شفاف نبودهاند. در اوایل این ماه، هنرمندان و عکاسان اپل را به دلیل فاش نکردن منبع دادههای آموزشی برای Apple Intelligence مورد انتقاد قرار دادند.
آموزش بدون مجوز مدلهای هوش مصنوعی از رونوشتهای متنی یوتیوب توسط غولهای فناوری
سايت خبری ايتنا , 29 تير 1403 ساعت 15:21
ایتنا - تاکنون، شرکتهای هوش مصنوعی درباره دادههای مورد استفاده برای آموزش مدلهای خود شفاف نبودهاند. در اوایل این ماه، هنرمندان و عکاسان اپل را به دلیل فاش نکردن منبع دادههای آموزشی برای Apple Intelligence مورد انتقاد قرار دادند.
تحقیقات جدید وبسایت Proof News نشان میدهد که برخی از بزرگترین شرکتهای فناوری جهان مدلهای هوش مصنوعی خود را بر روی دیتاستی، که شامل رونوشتهای بیش از 173000 ویدیوی یوتیوب بود، بدون مجوز آموزش دادهاند.
به گزارش ایتنا و به نقل از انگجت، این دیتاست که توسط یک شرکت غیرانتفاعی به نام EleutherAI ایجاد شده است، حاوی رونوشتهایی از ویدئوهای یوتیوب از بیش از 48000 کانال است، و از جمله توسط اپل، انویدیا و آنتروپیک استفاده شده است. یافتههای این تحقیقات واقعیت ناراحتکنندهای را درباره هوش مصنوعی روشن میکند: این فناوری عمدتاً بر پایه دادههایی ساخته شده است که از تولیدکنندگان محتوا بدون کسب رضایت یا پرداخت غرامت به آنها استخراج شده است.
این دیتاست شامل هیچ ویدیو یا تصویری از یوتیوب نیست، اما شامل رونوشتهای ویدیویی از بزرگترین تولیدکنندگان محتوا در این پلتفرم از جمله مارکز براونلی و MrBeast، و همچنین ناشران بزرگ خبری مانند نیویورکتایمز، بیبیسی و ABC News است. زیرنویسهای ویدیوهای متعلق به انگجت نیز بخشی از این دیتاست است.
براونلی در اکانت خود در ایکس اینگونه نوشت: «اپل دادههای هوش مصنوعی خود را از چندین شرکت تهیه کرده است.» او افزود: «یکی از آنها هزاران دیتا/رونوشت را از ویدیوهای یوتیوب، از جمله مال من، جمعآوری کرده است. وی افزود: «این یک مشکل رو به گسترش برای مدتی طولانی خواهد بود».
کد مطلب: 79856