«کمبود داده» ممکن است مشکل بزرگی برای استراتژی معمول مقیاسگذاری هوش مصنوعی باشد. یکی از گزینهها میتواند برداشت اطلاعات غیرعمومی مانند پیامهای واتساپ یا متون ویدیوهای یوتیوب باشد. اما قانونی بودن این نوع برداشت داده، هنوز مسجل نشده است.
انقلاب هوش مصنوعی با کمبود دادهها مواجه است؛ چه باید کرد؟
سايت خبری ايتنا , 27 آذر 1403 ساعت 0:00
«کمبود داده» ممکن است مشکل بزرگی برای استراتژی معمول مقیاسگذاری هوش مصنوعی باشد. یکی از گزینهها میتواند برداشت اطلاعات غیرعمومی مانند پیامهای واتساپ یا متون ویدیوهای یوتیوب باشد. اما قانونی بودن این نوع برداشت داده، هنوز مسجل نشده است.
توسعهدهندگان هوش مصنوعی به سرعت در حال استخراج اطلاعات از اینترنت برای آموزش مدلهای زبانی بزرگ مانند چتجیپیتی (ChatGPT) هستند. اما اکنون با مشکل کمبود داده مواجه شدهاند.
به گزارش ایتنا، دهه گذشته شاهد پیشرفتهای چشمگیری در هوش مصنوعی بوده است که عمدتاً ناشی از افزایش ظرفیت شبکههای عصبی و آموزش آنها با دادههای بیشتر بوده است. این مقیاسگذاری به طور غیرمنتظرهای مؤثر واقع شده و مدلهای زبانی بزرگ (LLM) را قادر به تقلید زبان محاورهای و توسعه ویژگیهای نوظهور مانند استدلال کرده است. اما برخی متخصصان معتقدند که ما به محدودیتهای مقیاسگذاری نزدیک میشویم.
مطالعهای که امسال منتشر شد، پیشبینی کرده است که تا سال 2028، اندازه معمول مجموعه دادهها برای آموزش مدلهای هوش مصنوعی به اندازه کل محتوای عمومی آنلاین خواهد رسید. به عبارت دیگر، احتمالاً هوش مصنوعی تا چهار سال دیگر از دادههای آموزشی خالی خواهد شد.
در همین حال، مالکان دادهها مانند ناشران روزنامهها شروع به محدود کردن نحوه استفاده از محتوای خود کردهاند که این امر بحران جدیدی را در ظرفیت «دادههای عمومی» ایجاد کرده است.
کد مطلب: 82255
آدرس مطلب: https://www.itna.ir/news/82255/انقلاب-هوش-مصنوعی-کمبود-داده-ها-مواجه-باید