مدل هوش مصنوعی دانشمندان سابق متا، پروتئینهایی «غیرطبیعی» تولید میکند
ایتنا - همانطور که چتجیبیتی متن را با پیشبینی کلمه بعدی در یک توالی تولید میکند، یک مدل جدید هوش مصنوعی نیز میتواند پروتئینهایی از صفر ایجاد کند که به طور طبیعی وجود ندارند.
پروتئین esmGPF که توسط مدل ESM3 از چتجیپیتی تولید شده، نسبت به پروتئینهای طبیعی کاملاً متفاوت است. دانشمندان ادعا میکنند که ایجاد آن با تکامل طبیعی ۵۰۰ میلیون سال طول میکشید.
به گزارش ایتنا و به نقل از لایوساینس، دانشمندان برای ایجاد یک پروتئین فلورسنت جدید از مدل جدید ESM3 استفاده کردند که تنها ۵۸ درصد از توالی آن با پروتئینهای فلورسنت طبیعی مشابه است. نمایندگان شرکت EvolutionaryScale (شرکتی که توسط پژوهشگران سابق متا تأسیس شده)، جزئیات بیشتری بیان کردند.
این گروه پژوهشی نسخه کوچکی از مدل را تحت یک مجوز غیرتجاری منتشر کرده و قصد دارند نسخه بزرگتر آن را در دسترس محققان تجاری قرار دهند. به گفته نمایندگان EvolutionaryScale، این فناوری میتواند در زمینههایی مانند کشف دارو و طراحی مواد شیمیایی جدید جهت تجزیه پلاستیک مفید واقع شود.
گفتنی استESM3 یک مدل زبان بزرگ (LLM) مشابه GPT-4 شرکت OpenAI است که چتبات چتجیبیتی قدرت خود را از آن میگیرد. دانشمندان بزرگترین نسخه این مدل را بر روی ۲٫۷۸ میلیارد پروتئین آموزش دادهاند.
آنها برای هر پروتئین، اطلاعاتی درباره توالی (ترتیب بلوکهای ساختاری آمینواسید که پروتئین را تشکیل میدهد)، ساختار (شکل سهبعدی تاخورده پروتئین) و عملکرد (کارکرد پروتئین) استخراج کردند. این دانشمندان به طور تصادفی بخشهایی از این اطلاعات را مخفی کردند و از ESM3 خواستند تا بخشهای گمشده را پیشبینی کند.
دانشمندان سپس اشاره کردند که محدودیتهایی در پیشبینیهای این مدلهای هوش مصنوعی وجود دارد و اینکه پیشبینیهای پروتئینی باید تأیید شوند. با این حال، این روشها میتوانند تا حد قابل توجهی جستوجوی ساختارهای پروتئینی را سرعت بخشند؛ زیرا روش جایگزین استفاده از پرتو ایکس برای نقشهبرداری ساختارهای پروتئینی به صورت تکی انجام میشود که کند و پرهزینه است.
مدل ESM3 فراتر از پیشبینی پروتئینهای موجود عمل میکند
گفته میشود که این مدل با استفاده از اطلاعات حاصل از ۷۷۱ میلیارد قطعه اطلاعات منحصربهفرد در مورد ساختار، عملکرد و توالی، میتواند پروتئینهای جدید با عملکردهای خاص ایجاد کند. یکی از پشتیبانان EvolutionaryScale از این مدل به عنوان «لحظه تاریخی چتجیپیتی برای زیستشناسی» یاد کرده است.
در مطالعه جدید، پژوهشگران از مدل خواستند تا یک پروتئین فلورسنت جدید تولید کند. این نوع پروتئین نور را جذب کرده و در طول موج بلندتری منتشر میکند و باعث میشود به رنگ سبز بدرخشد.
این پروتئینها به پژوهشگران زیستشناسی کمک میکننند آنها را به مولکولهایی که قصد مطالعهشان را دارند متصل کنند تا آنها را مورد ردیابی و تصویربرداری قرار دهند. اهمیت کشف و توسعه این مواد تا حدی است که در سال ۲۰۰۸ جایزه نوبل شیمی برای آن در نظر گفته شد.
گفتنی است این مدل توانست ۹۶ پروتئین با توالیها و ساختارهایی که احتمال تولید فلورسانس داشتند تولید کند. پژوهشگران سپس یکی را با کمترین توالیهای مشترک با پروتئینهای فلورسنت طبیعی انتخاب کردند. اگرچه این پروتئین ۵۰ بار کمنورتر از پروتئینهای فلورسنت سبز طبیعی بود، اما ESM3 نسخه جدیدی تولید کرد که منجر به توالیهای جدیدی شد و درخشندگی را افزایش داد.
نتیجه حاصل، یک پروتئین فلورسنت سبز متفاوت با تمام پروتئینهای طبیعی بود که "esmGPF" نامیده شد. جالب اینکه تخمین زده میشود این تحولات که توسط هوش مصنوعی تنها در چند لحظه انجام شدند، در طی تکامل طبیعی ۵۰۰ میلیون سال طول میکشد!
نمایندگان شرکت EvolutionaryScale در پایان میگویند: «در حال حاضر ما هنوز درکی اساسی از چگونگی رفتار پروتئینها در یک سیستم زنده، بهویژه آنهایی که در علم جدید به شمار میروند، نداریم، اما این یک گام جدید و هیجانانگیز است که به ما امکان میدهد به بیولوژی سنتزی به شیوهای جدید ورود کنیم. مدلسازی هوش مصنوعی مانند ESM3 کشف پروتئینهای جدیدی را ممکن میسازد که محدودیتهای انتخاب طبیعی هرگز اجازه ایجاد آن را نمیدهند و همچنین زمینهساز نوآوریهایی در مهندسی پروتئین است که تکامل نمیتواند آنها را پدید بیاورد و این نکته بسیار هیجانانگیز است».