AlphaFold 3 آن را پیشبینی کرد. اکنون زیستشناسان از آن برای یافتن دارو استفاده میکنند.

وقتی DeepMind AlphaFold 2 را در سال 2020 منتشر کرد، یک چالش بزرگ 50 ساله در زیستشناسی را حل کرد: پیشبینی چگونگی تا خوردن یک زنجیره از اسیدهای آمینه به یک ساختار سهبعدی پروتئین. جامعه علمی آن را یک لحظه سرنوشتساز نامید. کل برنامههای تحقیقاتی که زمانی به سالها کار با کریستالوگرافی اشعه ایکس یا میکروسکوپ الکترونی کرایو نیاز داشتند، اکنون میتوانستند به صورت محاسباتی در عرض چند ساعت انجام شوند. تا سال 2022، پایگاه داده ساختار پروتئین AlphaFold حاوی ساختارهای پیشبینی شده برای تقریباً تمام پروتئینهای پروتئوم انسانی و صدها میلیون پروتئین دیگر در سراسر حیات روی زمین بود.
سپس، در می 2024، DeepMind AlphaFold 3 را منتشر کرد — و سوال را کاملاً تغییر داد.
آنچه AlphaFold 3 واقعاً اضافه کرد
AlphaFold 2 در پیشبینی ساختارهای پروتئین به صورت مجزا استثنایی بود. AlphaFold 3 این قابلیت را به اکوسیستم مولکولی کامل گسترش داد: DNA، RNA، لیگاندهای مولکول کوچک، یونها و اصلاحات شیمیایی، که همگی به صورت مشترک با پروتئینها در یک مدل واحد پیشبینی میشوند. این یک بهبود حاشیهای نیست — این یک تغییر اساسی در معنای پیشبینی ساختار برای کشف دارو است.
تغییر معماری به همان اندازه قابل توجه بود. AlphaFold 3 ستون فقرات Evoformer را با یک معماری مبتنی بر انتشار جایگزین کرد و از تکنیکهای مدلهای تولید تصویر برای اصلاح تکراری مختصات اتمی سهبعدی از نویز استفاده کرد. در معیار PoseBusters — یک آزمایش چالشبرانگیز از حالتهای مولکولهای شبهداروی فیزیکی قابل قبول در محلهای اتصال پروتئین — AlphaFold 3 بیش از 50٪ بهبود نسبت به روشهای پیشرفته قبلی به دست آورد. برای شکارچیان دارو، این عدد اهمیت دارد: پیشبینی دقیق نحوه اتصال یک لیگاند مولکول کوچک به محل فعال پروتئین یکی از قدیمیترین و محاسباتیترین مسائل در تحقیقات داروسازی است.
شرط داروسازی
پیامدهای تجاری برای صنعت پنهان نبود. Isomorphic Labs، شرکت خواهر DeepMind که بر کشف داروی مبتنی بر هوش مصنوعی متمرکز است، در ژانویه 2024 یک مشارکت تاریخی با Eli Lilly به ارزش تا 1.7 میلیارد دلار اعلام کرد — یکی از بزرگترین معاملات هوش مصنوعی-داروسازی در تاریخ. این همکاری به طور خاص بر روی استفاده از ابزارهای پیشرفته پیشبینی ساختار و طراحی مولکولی در خط لوله دارویی Lilly متمرکز است.
Recursion Pharmaceuticals پیشبینیهای AlphaFold را در پلتفرم غربالگری بیولوژیکی با توان بالا خود ادغام کرده است و از دادههای ساختاری برای اولویتبندی ترکیباتی که باید سنتز و آزمایش شوند استفاده میکند. در CASP16 — مسابقه دوسالانه ارزیابی بحرانی پیشبینی ساختار که در اواخر سال 2024 برگزار شد — روشهای مبتنی بر هوش مصنوعی برای اولین بار در پیشبینی ساختار RNA غالب شدند، دستهای که ابزارهای قبلی در آن به شدت مشکل داشتند. توانایی مدلسازی دقیق ساختارهای RNA درها را به روی کلاسهای هدف کاملاً جدیدی باز میکند، از جمله داروهای هدفگیرنده RNA که به یک حوزه اصلی سرمایهگذاری داروسازی تبدیل شدهاند.
جنجال دسترسی
استراتژی انتشار DeepMind برای AlphaFold 3 بلافاصله با انتقاد جامعه دانشگاهی روبرو شد. برخلاف AlphaFold 2، که وزنهای آن به طور کامل متنباز بود و یک اکوسیستم کامل از ابزارها را فعال کرد، وزنهای مدل AlphaFold 3 در ابتدا تحت شرایط بسیار محدودکنندهای منتشر شد — برای تحقیقات دانشگاهی در دسترس بود اما برای هیچ کاربرد تجاری، و با محدودیتهایی که ادغام در خطوط لوله باز را دشوار میکرد.
واکنش شدید بود. محققان استدلال کردند که محدود کردن وزنهای یک مدل که عمدتاً بر اساس علم با بودجه عمومی ساخته شده است، یک مزیت ناعادلانه برای شرکتهای داروسازی با منابع خوب ایجاد میکند. DeepMind متعاقباً به سمت یک ترتیبات مجوزدهی مجازتر برای استفاده دانشگاهی غیرتجاری حرکت کرد، اگرچه محدودیتهای تجاری باقی ماند.
این جنجال توسعه جایگزینهای باز را تسریع کرد. RoseTTAFold All-Atom، از آزمایشگاه Baker در دانشگاه واشنگتن، پیشبینی مشترک پروتئین-لیگاند-اسید نوکلئیک با وزنهای کاملاً باز ارائه میدهد. Chai-1، که توسط Chai Discovery در سال 2024 منتشر شد، عملکرد AlphaFold 3 را در چندین معیار مطابقت میدهد و تحت یک مجوز تحقیقاتی مجاز در دسترس است. Boltz-1، از MIT، یک پیادهسازی باز دیگر ارائه میدهد. این ابزارها با هم تضمین کردهاند که جامعه تحقیقاتی دسترسی به پیشبینی ساختار پیشرفته را بدون وابستگی به یک دروازهبان شرکتی واحد حفظ کند.
آنچه مدلها هنوز نمیتوانند انجام دهند
پیشبینی ساختار یک گلوگاه را حل کرده است در حالی که گلوگاههای دیگر را دست نخورده باقی گذاشته است. اساسیترین محدودیت این است که این مدلها عکسهای فوری ایستا را پیشبینی میکنند — یک ساختار با کمترین انرژی — به جای مجموعه پویای ساختارهایی که یک پروتئین در دمای فیزیولوژیکی نمونهبرداری میکند. زیستشناسی بر اساس حرکت کار میکند: آنزیمها برای کاتالیز واکنشها شکل خود را تغییر میدهند، گیرندهها برای اتصال مولکولهای سیگنالدهی خم میشوند، پروتئینهای ذاتاً بینظم دقیقاً به این دلیل عمل میکنند که ساختار ثابتی ندارند. تخمین زده میشود که 30 تا 40 درصد از پروتئوم انسانی از مناطق ذاتاً بینظم تشکیل شده است که AlphaFold و جانشینان آن به خوبی با آنها برخورد نمیکنند، همانطور که در نمرات اطمینان پایین pLDDT برای آن بخشها منعکس شده است.
پروتئینهای غشایی یک چالش جداگانه را ارائه میدهند. این اهداف — که تقریباً 60٪ از داروهای تأیید شده را تشکیل میدهند — در یک محیط دولایه لیپیدی وجود دارند که شبیهسازی دقیق آن دشوار است و ساختارهای پیشبینی شده آنها عدم قطعیت بالاتری نسبت به پروتئینهای محلول دارند. مدلها همچنین با تغییرات ساختاری بزرگ ناشی از اتصال لیگاند، نوع دینامیک القایی که برای درک گزینشپذیری دارو و اثرات خارج از هدف حیاتی است، مشکل دارند.
اکوسیستم باز فراتر از DeepMind
این زمینه به یک اکوسیستم باز غنی تبدیل شده است. ESMFold متا، بر اساس مدل زبانی ESM که بر روی دادههای توالی تکاملی به جای همترازیهای چندگانه توالی آموزش دیده است، استنتاج بسیار سریعتری را ارائه میدهد — که برای کاربردهای غربالگری در مقیاس بزرگ که سرعت مهمتر از دقت است مفید است. OpenFold یک پیادهسازی مجدد کاملاً باز از AlphaFold 2 ارائه میدهد که محققان میتوانند آن را بر روی مجموعه دادههای سفارشی دوباره آموزش دهند و تنظیم دقیق کنند.
ESM3 از Evolutionary Scale، که در سال 2024 منتشر شد، رویکرد جاهطلبانهتری را در پیش میگیرد: یک مدل مولد چندوجهی که به طور مشترک بر روی توالی، ساختار و عملکرد پروتئین استدلال میکند. در جایی که AlphaFold ساختار را از توالی پیشبینی میکند، ESM3 میتواند توالیهای جدیدی تولید کند که به ساختارهای هدف تا میخورند — و شروع به بستن حلقه بین پیشبینی و طراحی میکند.
زیرساخت پایگاه داده نیز همگام بوده است. بانک داده پروتئین اکنون حاوی بیش از 220,000 ساختار تعیین شده تجربی است که در طول پنج دهه کار جمعآوری شده است. پایگاه داده AlphaFold، که به طور مشترک توسط DeepMind و EMBL-EBI نگهداری میشود، به بیش از 200 میلیون ساختار پیشبینی شده رشد کرده است که بیشتر پروتئینهای شناخته شده در تمام حوزههای حیات را پوشش میدهد. این ترکیب از حقیقت زمینی تجربی و پوشش محاسباتی در مقیاس، آنچه را که در زیستشناسی ساختاری تطبیقی ممکن است متحول کرده است.
یک گلوگاه برداشته شد، نه زیستشناسی حل شد
دو سال پس از انتشار AlphaFold 3، ارزیابی صادقانه این است: این یک گلوگاه واقعی و قابل توجه در خط لوله کشف دارو را برداشت، اما کشف دارو را آسان نکرد. پیشبینی ساختار یکی از چندین مرحله محدودکننده نرخ بود — در کنار اعتبارسنجی هدف، پروفایل ADMET، ترجمه بالینی و غیرقابل پیشبینی بودن اساسی زیستشناسی انسانی در داخل بدن. حل آن با دقت بالا مراحل اولیه طراحی داروی مبتنی بر ساختار را تسریع کرده است و کلاسهای هدفی را که قبلاً غیرقابل دسترس بودند باز کرده است.
معاملات تجاری، جایگزینهای باز، رشد پایگاه داده و ادامه تلاش به سمت دینامیک و طراحی مولد، همه نشان میدهند که این زمینه در یک گذار واقعی است. اما شکاف بین یک حالت اتصال زیبا پیشبینی شده و یک دارویی که در بیماران مؤثر است همچنان عظیم است — و پر از زیستشناسی است که هیچ مدلی هنوز نمیداند چگونه پیشبینی کند.