ايتنا - امکان درز اطلاعات از طریق پلتفرم‌های هوش مصنوعی وجود دارد؟

گروهی از محققان دانشگاه‌های آمریکا و سوئیس، با همکاری گوگل و شرکت زیرمجموعه آن DeepMind با انجام یک تحقیق مشترک به بررسی امکان درز اطلاعات از طریق پلتفرم‌های مبتنی بر هوش مصنوعی پرداختند.

مدل‌های مولد هوش مصنوعی مورد استفاده در این پلتفرم‌ها بر روی تعداد بسیار زیادی از تصاویر با توضیحات از پیش تعیین شده آموزش دیده بودند. ایده این بود که شبکه‌های عصبی پس از پردازش حجم عظیمی از داده‌های آموزشی قادر به تولید تصاویر جدید و منحصر به فرد هستند.

با این حال، مطالعه جدید نشان داده است که این تصاویر همیشه منحصر به فرد نیستند، به گونه‌ای که در برخی موارد، شبکه عصبی دقیقا تصویری را مطابق با تصویر استفاده شده در آموزش قبلی بازتولید می‌کند.

این مطالعه دیدگاه‌هایی را به چالش می‌کشد که معتقد هستند مدل‌های هوش مصنوعی که برای تولید تصاویر استفاده می‌شوند، داده‌های آموزشی خود را ذخیره نمی‌کنند، و اینکه داده‌های آموزشی می‌تواند در صورت عدم افشا، خصوصی باقی بمانند.

نتایج سیستم‌های یادگیری عمیق می‌تواند برای افراد غیرمتخصص شگفت‌انگیز باشد، اما در واقع هیچ سحر و جادویی در این موضوع وجود ندارد، زیرا همه شبکه‌های عصبی کار خود را بر اساس یک اصل یعنی آموزش و با استفاده از مجموعه‌ای بزرگ از داده‌ها و توضیحات دقیق هر تصویر مانند مجموعه‌ای از تصاویر گربه‌ها و سگ‌ها انجام می‌دهند.

پس از آموزش، شبکه عصبی تصویر جدیدی را نمایش می‌دهد و از او خواسته می‌شود تا مشخص کند که این تصویر گربه است یا سگ. از این نکته کوچک، توسعه‌دهندگان این مدل‌ها به سناریو‌های پیچیده‌تر منتقل می‌شوند و با استفاده از الگوریتمی که روی تصاویر بسیاری از گربه‌ها آموزش داده شده، تصویری از یک حیوان خانگی که وجود ندارد، می‌سازند. این آزمایش‌ها نه تنها با تصاویر، بلکه با متن، ویدئو و حتی صدا نیز انجام می‌شود.

نقطه شروع برای همه شبکه‌های عصبی، مجموعه‌ای از داده‌های آموزشی است. شبکه‌های عصبی نمی‌توانند اشیاء جدیدی را از خود ایجاد کنند. به عنوان مثال، برای ایجاد تصویری از یک گربه، الگوریتم باید هزاران عکس یا نقاشی واقعی از گربه‌ها را مطالعه کند.

تلاش های زیاد برای محرمانه نگه داشتن مجموعه داده‌ها
محققان در مقاله خود توجه ویژه‌ای به مدل‌های یادگیری ماشینی داشته اند. آن‌ها به شرح زیر عمل کرده اند: داده‌های آموزشی (اعم از تصاویر افراد، ماشین ها، خانه‌ها و...) را با اضافه کردن نویز تحریف می‌کنند. سپس شبکه عصبی برای بازیابی این تصاویر به حالت اولیه آموزش داده می‌شود.

این روش امکان تولید تصاویر با کیفیت قابل قبول را فراهم می‌کند، اما یک نقطه ضعف بالقوه آن در مقایسه با الگوریتم‌ها در شبکه‌های رقابتی مولد، تمایل بیشتر آن به درز داده‌ها است؛ به گونه‌ای که داده‌های اصلی را می‌توان حداقل به سه روش مختلف از آن استخراج کرد:

- استفاده از پرسش‌های خاص برای وادار کردن شبکه عصبی برای خارج کردن یک تصویر منبع خاص و نه چیزی منحصر به فرد که بر اساس هزاران تصویر ایجاد شده است.
- تصویر اصلی حتی اگر تنها بخشی از آن موجود باشد قابل بازسازی است.
- به سادگی می‌توان تعیین کرد که آیا یک تصویر خاص در داده‌های آموزشی گنجانده شده است یا خیر.

بسیاری از اوقات، شبکه‌های عصبی تنبل هستند و به جای تولید یک تصویر جدید، اگر دارای چندین تکرار از یک تصویر باشد، چیزی از مجموعه آموزشی را تولید می‌کنند؛ بنابراین اگر تصویری بیش از صد بار در مجموعه آموزشی تکرار شود، احتمال لو رفتن آن به شکل تقریباً اصلی بسیار زیاد است.

با این حال، محققان راه‌هایی را برای بازیابی تصاویر آموزشی نمایش داده اند که تنها یک بار در مجموعه اصلی ظاهر شده است؛ به گونه‌ای که از بین ۵۰۰ تصویری که محققان آزمایش کرده اند، این الگو به طور تصادفی سه مورد از آن‌ها را ایجاد کرده است.

در ژانویه ۲۰۲۳، سه هنرمند از پلتفرم‌های تولید تصویر مبتنی بر هوش مصنوعی به دلیل استفاده از تصاویر آنلاین خود برای آموزش مدل هایشان بدون رعایت حق چاپ شکایت کردند.

یک شبکه عصبی در واقع می‌تواند سبک یک هنرمند را کپی کند و در نتیجه او را از درآمد محروم کند. این مقاله تاکید دارد که در برخی موارد، الگوریتم‌ها می‌توانند به دلایل مختلف دست به سرقت علمی واقعی بزنند و نقاشی‌ها، عکس‌ها و تصاویر دیگری تولید کنند که تقریباً مشابه کار افراد واقعی است؛ بنابراین محققان توصیه‌هایی را برای تقویت خصوصی سازی مجموعه آموزشی اصلی ارائه کرده اند:

۱- حذف تکرار در گروه‌های آموزشی.
۲- پردازش مجدد تصاویر آموزشی، به عنوان مثال با اضافه کردن نویز یا تغییر روشنایی. این باعث می‌شود احتمال نشت داده‌ها کمتر شود.
۳- تست الگوریتم با استفاده از تصاویر آموزشی ویژه و سپس بررسی عدم بازتولید ناخواسته آن با دقت.

منبع: باشگاه خبرنگاران جوان