بات جدید OpenAI در اینترنت برای چت جیپیتی اطلاعات جمع میکند
ایتنا - سیستم جدید که «جیپیتیبات» نام دارد، در میان دادهها و متنها در وب میچرخد تا برای آموزش دادن به مدلهای آتی، اطلاعات بیشتری جمعآوری کند.
اوپنایآی بات جدیدی ساخته است که در اینترنت میچرخد و به منظور آموزش دادن به سیستمهای هوش مصنوعی، اطلاعات جمعآوری میکند.
به گزارش ایتنا و به نفل از ایندیپندنت، اپراتور وبسایتها در صورتی که بخواهند مانع از این شوند که این بات از سایت آنها داده دریافت کند، مجبور خواهند شد این موضوع را قبول نکنند و بات را بلاک کنند.
سیستمهای هوش مصنوعی مانند چتجیپیتی اوپنایآی به منظور آموزش دادن به مدلهایشان و یادگیری نحوه ارائه خروجیهای درست، به حجم زیادی از دادهها متکیاند. تا کنون بسیاری از این دادهها به رایگان از اینترنت برداشته شدهاند.
این مسئله شکایتهای متعدد نویسندگان و سایر کاربران اینترنت را به دنبال داشته است. بسیاری از اوپنایآی و سایرین به دلیل استفاده از اطلاعات شخصی و محتوای دارای حق نشر [کپیرایت] برای آموزش مدلهایشان که از این متنها به طور بالقوه به عنوان اطلاعات [ورودی] استفاده میکنند یا حتی این متنها در پاسخهای سیستم تکرار میشوند، انتقاد کردهاند.
شرکتهای هوش مصنوعی با انتقاد افراد دیگری نیز مواجه شدهاند که ادعا میکنند چنین وبگردهایی یا اصطلاحا خزندگان وب زیرساخت وب آنها را مجبور میکنند از نهایت ظرفیتش استفاده کند. به عنوان نمونه، ایلان ماسک گفته که بار این باتها توییتر را مجبور کرده است تعداد پستهایی را که کاربران میتوانند در سایت مشاهده کنند، محدود کند.
چتجیپیتی ۳.۵ و ۴ موجود اوپنایآی بر اساس دادههای برداشتهشده از اینترنت تا اواخر سال ۲۰۲۱ آموزش داده شدهاند. برای مالکان آن دادهها یا برای وبسایتهایی که این دادهها از آنها جمعآوری شدهاند، هیچ راهی وجود ندارد که این اطلاعات را از مدلهای اوپنایآی حذف کنند.
اینک اوپنایآی میگوید سیستم جدید که «جیپیتیبات» نام دارد، در میان دادهها و متنها در وب میچرخد تا برای آموزش دادن به مدلهای آتی، اطلاعات بیشتری جمعآوری کند.
به مدیران وبسایتها گفته شده که اگر نمیخواهند این اطلاعات جمعآوری شود، باید برای بات دستورالعملهایی قرار دهند تا از چرخیدن آن در وبسایتشان جلوگیری کنند. مدیران میتوانند چنین اطلاعاتی را در فایلی به نام robots.txt قرار دهند که به سایر خزندگان وبــ مانند خزندگان وبی که گوگل برای نتایج جستوجویش از آنها استفاده میکندــ دستورالعملهایی میدهد.
اوپنایآی میگوید از این بات «احتمالا ممکن است به منظور بهبود مدلهای آینده استفاده شود». همچنین میگوید که این بات برای «حذف منابعی» ساخته شده است که به پیوال (Paywall) [محتواهایی روی اینترنت که برای مشاهده آن باید پول پرداخت کرد] نیاز دارند، اطلاعات شخصی قابلشناسایی را گرآوری میکنند یا متنی دارند که قوانین اوپنایآی را نقض میکنند.
اوپنایآی میگوید که اجازه دادن به باتها برای دسترسی به سایتها «میتواند به مدلهای هوش مصنوعی کمک کند دقیقتر شوند و قابلیتهای عمومی و ایمنی را بهبود ببخشند».