IRCNF

AlphaFold 3 آن را پیش‌بینی کرد. اکنون زیست‌شناسان از آن برای یافتن دارو استفاده می‌کنند.

اشتراک‌گذاری:
AlphaFold 3 آن را پیش‌بینی کرد. اکنون زیست‌شناسان از آن برای یافتن دارو استفاده می‌کنند.

وقتی DeepMind AlphaFold 2 را در سال 2020 منتشر کرد، یک چالش بزرگ 50 ساله در زیست‌شناسی را حل کرد: پیش‌بینی چگونگی تا خوردن یک زنجیره از اسیدهای آمینه به یک ساختار سه‌بعدی پروتئین. جامعه علمی آن را یک لحظه سرنوشت‌ساز نامید. کل برنامه‌های تحقیقاتی که زمانی به سال‌ها کار با کریستالوگرافی اشعه ایکس یا میکروسکوپ الکترونی کرایو نیاز داشتند، اکنون می‌توانستند به صورت محاسباتی در عرض چند ساعت انجام شوند. تا سال 2022، پایگاه داده ساختار پروتئین AlphaFold حاوی ساختارهای پیش‌بینی شده برای تقریباً تمام پروتئین‌های پروتئوم انسانی و صدها میلیون پروتئین دیگر در سراسر حیات روی زمین بود.

سپس، در می 2024، DeepMind AlphaFold 3 را منتشر کرد — و سوال را کاملاً تغییر داد.

آنچه AlphaFold 3 واقعاً اضافه کرد

AlphaFold 2 در پیش‌بینی ساختارهای پروتئین به صورت مجزا استثنایی بود. AlphaFold 3 این قابلیت را به اکوسیستم مولکولی کامل گسترش داد: DNA، RNA، لیگاندهای مولکول کوچک، یون‌ها و اصلاحات شیمیایی، که همگی به صورت مشترک با پروتئین‌ها در یک مدل واحد پیش‌بینی می‌شوند. این یک بهبود حاشیه‌ای نیست — این یک تغییر اساسی در معنای پیش‌بینی ساختار برای کشف دارو است.

تغییر معماری به همان اندازه قابل توجه بود. AlphaFold 3 ستون فقرات Evoformer را با یک معماری مبتنی بر انتشار جایگزین کرد و از تکنیک‌های مدل‌های تولید تصویر برای اصلاح تکراری مختصات اتمی سه‌بعدی از نویز استفاده کرد. در معیار PoseBusters — یک آزمایش چالش‌برانگیز از حالت‌های مولکول‌های شبه‌داروی فیزیکی قابل قبول در محل‌های اتصال پروتئین — AlphaFold 3 بیش از 50٪ بهبود نسبت به روش‌های پیشرفته قبلی به دست آورد. برای شکارچیان دارو، این عدد اهمیت دارد: پیش‌بینی دقیق نحوه اتصال یک لیگاند مولکول کوچک به محل فعال پروتئین یکی از قدیمی‌ترین و محاسباتی‌ترین مسائل در تحقیقات داروسازی است.

شرط داروسازی

پیامدهای تجاری برای صنعت پنهان نبود. Isomorphic Labs، شرکت خواهر DeepMind که بر کشف داروی مبتنی بر هوش مصنوعی متمرکز است، در ژانویه 2024 یک مشارکت تاریخی با Eli Lilly به ارزش تا 1.7 میلیارد دلار اعلام کرد — یکی از بزرگترین معاملات هوش مصنوعی-داروسازی در تاریخ. این همکاری به طور خاص بر روی استفاده از ابزارهای پیشرفته پیش‌بینی ساختار و طراحی مولکولی در خط لوله دارویی Lilly متمرکز است.

Recursion Pharmaceuticals پیش‌بینی‌های AlphaFold را در پلتفرم غربالگری بیولوژیکی با توان بالا خود ادغام کرده است و از داده‌های ساختاری برای اولویت‌بندی ترکیباتی که باید سنتز و آزمایش شوند استفاده می‌کند. در CASP16 — مسابقه دوسالانه ارزیابی بحرانی پیش‌بینی ساختار که در اواخر سال 2024 برگزار شد — روش‌های مبتنی بر هوش مصنوعی برای اولین بار در پیش‌بینی ساختار RNA غالب شدند، دسته‌ای که ابزارهای قبلی در آن به شدت مشکل داشتند. توانایی مدل‌سازی دقیق ساختارهای RNA درها را به روی کلاس‌های هدف کاملاً جدیدی باز می‌کند، از جمله داروهای هدف‌گیرنده RNA که به یک حوزه اصلی سرمایه‌گذاری داروسازی تبدیل شده‌اند.

جنجال دسترسی

استراتژی انتشار DeepMind برای AlphaFold 3 بلافاصله با انتقاد جامعه دانشگاهی روبرو شد. برخلاف AlphaFold 2، که وزن‌های آن به طور کامل متن‌باز بود و یک اکوسیستم کامل از ابزارها را فعال کرد، وزن‌های مدل AlphaFold 3 در ابتدا تحت شرایط بسیار محدودکننده‌ای منتشر شد — برای تحقیقات دانشگاهی در دسترس بود اما برای هیچ کاربرد تجاری، و با محدودیت‌هایی که ادغام در خطوط لوله باز را دشوار می‌کرد.

واکنش شدید بود. محققان استدلال کردند که محدود کردن وزن‌های یک مدل که عمدتاً بر اساس علم با بودجه عمومی ساخته شده است، یک مزیت ناعادلانه برای شرکت‌های داروسازی با منابع خوب ایجاد می‌کند. DeepMind متعاقباً به سمت یک ترتیبات مجوزدهی مجازتر برای استفاده دانشگاهی غیرتجاری حرکت کرد، اگرچه محدودیت‌های تجاری باقی ماند.

این جنجال توسعه جایگزین‌های باز را تسریع کرد. RoseTTAFold All-Atom، از آزمایشگاه Baker در دانشگاه واشنگتن، پیش‌بینی مشترک پروتئین-لیگاند-اسید نوکلئیک با وزن‌های کاملاً باز ارائه می‌دهد. Chai-1، که توسط Chai Discovery در سال 2024 منتشر شد، عملکرد AlphaFold 3 را در چندین معیار مطابقت می‌دهد و تحت یک مجوز تحقیقاتی مجاز در دسترس است. Boltz-1، از MIT، یک پیاده‌سازی باز دیگر ارائه می‌دهد. این ابزارها با هم تضمین کرده‌اند که جامعه تحقیقاتی دسترسی به پیش‌بینی ساختار پیشرفته را بدون وابستگی به یک دروازه‌بان شرکتی واحد حفظ کند.

آنچه مدل‌ها هنوز نمی‌توانند انجام دهند

پیش‌بینی ساختار یک گلوگاه را حل کرده است در حالی که گلوگاه‌های دیگر را دست نخورده باقی گذاشته است. اساسی‌ترین محدودیت این است که این مدل‌ها عکس‌های فوری ایستا را پیش‌بینی می‌کنند — یک ساختار با کمترین انرژی — به جای مجموعه پویای ساختارهایی که یک پروتئین در دمای فیزیولوژیکی نمونه‌برداری می‌کند. زیست‌شناسی بر اساس حرکت کار می‌کند: آنزیم‌ها برای کاتالیز واکنش‌ها شکل خود را تغییر می‌دهند، گیرنده‌ها برای اتصال مولکول‌های سیگنال‌دهی خم می‌شوند، پروتئین‌های ذاتاً بی‌نظم دقیقاً به این دلیل عمل می‌کنند که ساختار ثابتی ندارند. تخمین زده می‌شود که 30 تا 40 درصد از پروتئوم انسانی از مناطق ذاتاً بی‌نظم تشکیل شده است که AlphaFold و جانشینان آن به خوبی با آنها برخورد نمی‌کنند، همانطور که در نمرات اطمینان پایین pLDDT برای آن بخش‌ها منعکس شده است.

پروتئین‌های غشایی یک چالش جداگانه را ارائه می‌دهند. این اهداف — که تقریباً 60٪ از داروهای تأیید شده را تشکیل می‌دهند — در یک محیط دولایه لیپیدی وجود دارند که شبیه‌سازی دقیق آن دشوار است و ساختارهای پیش‌بینی شده آنها عدم قطعیت بالاتری نسبت به پروتئین‌های محلول دارند. مدل‌ها همچنین با تغییرات ساختاری بزرگ ناشی از اتصال لیگاند، نوع دینامیک القایی که برای درک گزینش‌پذیری دارو و اثرات خارج از هدف حیاتی است، مشکل دارند.

اکوسیستم باز فراتر از DeepMind

این زمینه به یک اکوسیستم باز غنی تبدیل شده است. ESMFold متا، بر اساس مدل زبانی ESM که بر روی داده‌های توالی تکاملی به جای هم‌ترازی‌های چندگانه توالی آموزش دیده است، استنتاج بسیار سریع‌تری را ارائه می‌دهد — که برای کاربردهای غربالگری در مقیاس بزرگ که سرعت مهم‌تر از دقت است مفید است. OpenFold یک پیاده‌سازی مجدد کاملاً باز از AlphaFold 2 ارائه می‌دهد که محققان می‌توانند آن را بر روی مجموعه داده‌های سفارشی دوباره آموزش دهند و تنظیم دقیق کنند.

ESM3 از Evolutionary Scale، که در سال 2024 منتشر شد، رویکرد جاه‌طلبانه‌تری را در پیش می‌گیرد: یک مدل مولد چندوجهی که به طور مشترک بر روی توالی، ساختار و عملکرد پروتئین استدلال می‌کند. در جایی که AlphaFold ساختار را از توالی پیش‌بینی می‌کند، ESM3 می‌تواند توالی‌های جدیدی تولید کند که به ساختارهای هدف تا می‌خورند — و شروع به بستن حلقه بین پیش‌بینی و طراحی می‌کند.

زیرساخت پایگاه داده نیز همگام بوده است. بانک داده پروتئین اکنون حاوی بیش از 220,000 ساختار تعیین شده تجربی است که در طول پنج دهه کار جمع‌آوری شده است. پایگاه داده AlphaFold، که به طور مشترک توسط DeepMind و EMBL-EBI نگهداری می‌شود، به بیش از 200 میلیون ساختار پیش‌بینی شده رشد کرده است که بیشتر پروتئین‌های شناخته شده در تمام حوزه‌های حیات را پوشش می‌دهد. این ترکیب از حقیقت زمینی تجربی و پوشش محاسباتی در مقیاس، آنچه را که در زیست‌شناسی ساختاری تطبیقی ممکن است متحول کرده است.

یک گلوگاه برداشته شد، نه زیست‌شناسی حل شد

دو سال پس از انتشار AlphaFold 3، ارزیابی صادقانه این است: این یک گلوگاه واقعی و قابل توجه در خط لوله کشف دارو را برداشت، اما کشف دارو را آسان نکرد. پیش‌بینی ساختار یکی از چندین مرحله محدودکننده نرخ بود — در کنار اعتبارسنجی هدف، پروفایل ADMET، ترجمه بالینی و غیرقابل پیش‌بینی بودن اساسی زیست‌شناسی انسانی در داخل بدن. حل آن با دقت بالا مراحل اولیه طراحی داروی مبتنی بر ساختار را تسریع کرده است و کلاس‌های هدفی را که قبلاً غیرقابل دسترس بودند باز کرده است.

معاملات تجاری، جایگزین‌های باز، رشد پایگاه داده و ادامه تلاش به سمت دینامیک و طراحی مولد، همه نشان می‌دهند که این زمینه در یک گذار واقعی است. اما شکاف بین یک حالت اتصال زیبا پیش‌بینی شده و یک دارویی که در بیماران مؤثر است همچنان عظیم است — و پر از زیست‌شناسی است که هیچ مدلی هنوز نمی‌داند چگونه پیش‌بینی کند.

اشتراک‌گذاری:
AlphaFold 3 آن را پیش‌بینی کرد. اکنون زیست‌شناسان از آن برای یافتن دارو استفاده می‌کنند. | IRCNF - Intelligent Reliable Custom Next-gen Frameworks