امکان درز اطلاعات از طریق پلتفرمهای هوش مصنوعی وجود دارد؟
ایتنا - محققان در یک مقاله تحقیقاتی توضیح دادند که چگونه دادهها میتوانند از پلتفرمهای مبتنی بر هوش مصنوعی مولد درز پیدا کنند.
گروهی از محققان دانشگاههای آمریکا و سوئیس، با همکاری گوگل و شرکت زیرمجموعه آن DeepMind با انجام یک تحقیق مشترک به بررسی امکان درز اطلاعات از طریق پلتفرمهای مبتنی بر هوش مصنوعی پرداختند.
مدلهای مولد هوش مصنوعی مورد استفاده در این پلتفرمها بر روی تعداد بسیار زیادی از تصاویر با توضیحات از پیش تعیین شده آموزش دیده بودند. ایده این بود که شبکههای عصبی پس از پردازش حجم عظیمی از دادههای آموزشی قادر به تولید تصاویر جدید و منحصر به فرد هستند.
با این حال، مطالعه جدید نشان داده است که این تصاویر همیشه منحصر به فرد نیستند، به گونهای که در برخی موارد، شبکه عصبی دقیقا تصویری را مطابق با تصویر استفاده شده در آموزش قبلی بازتولید میکند.
این مطالعه دیدگاههایی را به چالش میکشد که معتقد هستند مدلهای هوش مصنوعی که برای تولید تصاویر استفاده میشوند، دادههای آموزشی خود را ذخیره نمیکنند، و اینکه دادههای آموزشی میتواند در صورت عدم افشا، خصوصی باقی بمانند.
نتایج سیستمهای یادگیری عمیق میتواند برای افراد غیرمتخصص شگفتانگیز باشد، اما در واقع هیچ سحر و جادویی در این موضوع وجود ندارد، زیرا همه شبکههای عصبی کار خود را بر اساس یک اصل یعنی آموزش و با استفاده از مجموعهای بزرگ از دادهها و توضیحات دقیق هر تصویر مانند مجموعهای از تصاویر گربهها و سگها انجام میدهند.
پس از آموزش، شبکه عصبی تصویر جدیدی را نمایش میدهد و از او خواسته میشود تا مشخص کند که این تصویر گربه است یا سگ. از این نکته کوچک، توسعهدهندگان این مدلها به سناریوهای پیچیدهتر منتقل میشوند و با استفاده از الگوریتمی که روی تصاویر بسیاری از گربهها آموزش داده شده، تصویری از یک حیوان خانگی که وجود ندارد، میسازند. این آزمایشها نه تنها با تصاویر، بلکه با متن، ویدئو و حتی صدا نیز انجام میشود.
نقطه شروع برای همه شبکههای عصبی، مجموعهای از دادههای آموزشی است. شبکههای عصبی نمیتوانند اشیاء جدیدی را از خود ایجاد کنند. به عنوان مثال، برای ایجاد تصویری از یک گربه، الگوریتم باید هزاران عکس یا نقاشی واقعی از گربهها را مطالعه کند.
تلاش های زیاد برای محرمانه نگه داشتن مجموعه دادهها
محققان در مقاله خود توجه ویژهای به مدلهای یادگیری ماشینی داشته اند. آنها به شرح زیر عمل کرده اند: دادههای آموزشی (اعم از تصاویر افراد، ماشین ها، خانهها و...) را با اضافه کردن نویز تحریف میکنند. سپس شبکه عصبی برای بازیابی این تصاویر به حالت اولیه آموزش داده میشود.
این روش امکان تولید تصاویر با کیفیت قابل قبول را فراهم میکند، اما یک نقطه ضعف بالقوه آن در مقایسه با الگوریتمها در شبکههای رقابتی مولد، تمایل بیشتر آن به درز دادهها است؛ به گونهای که دادههای اصلی را میتوان حداقل به سه روش مختلف از آن استخراج کرد:
- استفاده از پرسشهای خاص برای وادار کردن شبکه عصبی برای خارج کردن یک تصویر منبع خاص و نه چیزی منحصر به فرد که بر اساس هزاران تصویر ایجاد شده است.
- تصویر اصلی حتی اگر تنها بخشی از آن موجود باشد قابل بازسازی است.
- به سادگی میتوان تعیین کرد که آیا یک تصویر خاص در دادههای آموزشی گنجانده شده است یا خیر.
بسیاری از اوقات، شبکههای عصبی تنبل هستند و به جای تولید یک تصویر جدید، اگر دارای چندین تکرار از یک تصویر باشد، چیزی از مجموعه آموزشی را تولید میکنند؛ بنابراین اگر تصویری بیش از صد بار در مجموعه آموزشی تکرار شود، احتمال لو رفتن آن به شکل تقریباً اصلی بسیار زیاد است.
با این حال، محققان راههایی را برای بازیابی تصاویر آموزشی نمایش داده اند که تنها یک بار در مجموعه اصلی ظاهر شده است؛ به گونهای که از بین ۵۰۰ تصویری که محققان آزمایش کرده اند، این الگو به طور تصادفی سه مورد از آنها را ایجاد کرده است.
در ژانویه ۲۰۲۳، سه هنرمند از پلتفرمهای تولید تصویر مبتنی بر هوش مصنوعی به دلیل استفاده از تصاویر آنلاین خود برای آموزش مدل هایشان بدون رعایت حق چاپ شکایت کردند.
یک شبکه عصبی در واقع میتواند سبک یک هنرمند را کپی کند و در نتیجه او را از درآمد محروم کند. این مقاله تاکید دارد که در برخی موارد، الگوریتمها میتوانند به دلایل مختلف دست به سرقت علمی واقعی بزنند و نقاشیها، عکسها و تصاویر دیگری تولید کنند که تقریباً مشابه کار افراد واقعی است؛ بنابراین محققان توصیههایی را برای تقویت خصوصی سازی مجموعه آموزشی اصلی ارائه کرده اند:
۱- حذف تکرار در گروههای آموزشی.
۲- پردازش مجدد تصاویر آموزشی، به عنوان مثال با اضافه کردن نویز یا تغییر روشنایی. این باعث میشود احتمال نشت دادهها کمتر شود.
۳- تست الگوریتم با استفاده از تصاویر آموزشی ویژه و سپس بررسی عدم بازتولید ناخواسته آن با دقت.