آلفافولد ۳ در اختیار پژوهشگران قرار گرفت — یک سال دسترسی چه نتایجی واقعی به همراه داشته است؟

هنگامی که دیپمایند آلفافولد ۲ را در سال ۲۰۲۰ منتشر کرد، یک چالش بزرگ ۵۰ ساله در زیستشناسی را حل کرد: پیشبینی چگونگی تاخوردگی یک پروتئین از توالی اسیدآمینه آن به یک ساختار سهبعدی. واکنش جامعه علمی تقریباً یکپارچه بود — این یکی از مهمترین ابزارهای زیستی بود که تاکنون ساخته شده است. ظرف دو سال، آلفافولد ساختار بیش از ۲۰۰ میلیون پروتئین را پیشبینی کرد — اساساً تمام جهان پروتئینی شناخته شده — و آنها را از طریق پایگاه داده مؤسسه بیوانفورماتیک اروپا به صورت رایگان در دسترس قرار داد.
آلفافولد ۳ که در سال ۲۰۲۴ منتشر شد، فراتر رفت. این مدل نه تنها ساختارهای پروتئینی، بلکه ساختارهای کمپلکسهای پروتئینی — برهمکنش پروتئینها با DNA، RNA، لیگاندها و مولکولهای دارویی کوچک را به طور همزمان پیشبینی میکند. این همان قابلیتی است که حوزه کشف دارو منتظر آن بود: پیشبینی نه تنها ظاهر یک پروتئین، بلکه نحوه تعامل آن با درمانهای بالقوه در وضوح اتمی.
آلفافولد ۳ واقعاً چه چیزی را پیشبینی میکند
ارتقاء حیاتی در آلفافولد ۳ توانایی آن در مدلسازی برهمکنشهای مولکولی به جای ساختارهای منفرد است. یک مولکول دارو با اتصال به یک هدف پروتئینی خاص کار میکند — معمولاً با قرار گرفتن در یک حفره در ساختار پروتئین به گونهای که آن را فعال یا مهار میکند. پیشبینی دقیق این برهمکنش اتصال نیازمند مدلسازی تغییرات ساختاری است که هم پروتئین و هم مولکول دارو هنگام برخورد با یکدیگر متحمل میشوند.
آلفافولد ۳ از یک معماری مبتنی بر diffusion (مشابه مدلهای پشت تولید تصویر) به جای رویکرد مبتنی بر Transformer آلفافولد ۲ استفاده میکند که به آن امکان میدهد ورودیهای مولکولی ناهمگن — ترکیب پروتئینها، اسیدهای نوکلئیک و مولکولهای کوچک در یک پیشبینی واحد — را مدیریت کند. معیارهای منتشر شده در زمان عرضه نشان داد که این مدل در وظایف پیشبینی پروتئین-لیگاند از ابزارهای تخصصی docking بهتر عمل میکند، که نتیجهای بود توجه تیمهای کشف دارو را به خود جلب کرد.
پژوهشگران با آن چه کردهاند
فوریترین کاربرد، غربالگری مجازی بوده است: استفاده از آلفافولد ۳ برای پیشبینی نحوه اتصال هزاران یا میلیونها مولکول دارویی کاندید به یک پروتئین هدف، سپس فیلتر کردن به امیدوارکنندهترینها قبل از انجام آزمایشهای فیزیکی. این فرآیندی که زمانی یک فرآیند چند ساله شناسایی hit بود را به هفتهها فشرده میکند. چندین آزمایشگاه دانشگاهی پیشنوشتهایی منتشر کردهاند که کاندیدهای اتصال جدیدی را برای اهداف دشوار توصیف میکنند — از جمله پروتئینهای «غیرقابل دارورسانی» قبلی با حفرههای اتصال کم عمق یا پنهان — که به طور کامل از طریق غربالگری محاسباتی هدایتشده با آلفافولد ۳ شناسایی شدهاند.
طراحی آنتیبادی یکی دیگر از کاربردهای با ارزش بالا بوده است. پیشبینی نحوه اتصال یک آنتیبادی به آنتیژن خود — و طراحی واریانتهای آنتیبادی که محکمتر یا اختصاصیتر متصل میشوند — اکنون با آلفافولد ۳ به طور قابل توجهی سریعتر از ابزارهای محاسباتی قبلی است. Isomorphic Labs، زیرمجموعه کشف داروی دیپمایند، اعلام کرده است که چندین برنامه در خط لوله آن با کمک آلفافولد ۳ طراحی شده است، اگرچه دادههای بالینی تا سالها در دسترس نخواهد بود.
مهندسی آنزیم برخی از سریعترین نتایج ملموس را به همراه داشته است. پژوهشگران در چندین گروه دانشگاهی از آلفافولد ۳ برای طراحی واریانتهای آنزیمی جدید استفاده کردهاند که واکنشهای غیرطبیعی انجام میدهند — تجزیه پلیمرهای پلاستیکی خاص، سنتز آنالوگهای محصولات طبیعی پیچیده و کاتالیز واکنشها با گزینشپذیری بهبود یافته. مزیت سرعت چشمگیر است: چرخههای طراحی محاسباتی که قبلاً ماهها طول میکشید اکنون روزها طول میکشد.
آنچه هنوز نمیتواند انجام دهد
پیشبینیهای آلفافولد ۳ ایستا هستند. این مدل ساختار کمانرژی یک کمپلکس را پیشبینی میکند، نه دینامیک نحوه حرکت و انعطاف مولکولها در طول زمان. حرکت پروتئین — تغییرات ساختاری که نحوه ورود داروها به حفرههای اتصال، نحوه انتشار سیگنالهای آلوستریک، نحوه باز و بسته شدن آنزیمها را تعیین میکند — نیازمند شبیهسازی دینامیک مولکولی است که آلفافولد جایگزین آن نمیشود. بسیاری از شکستهای دارویی به این دلیل رخ میدهد که یک ترکیب به ساختار ایستای پیشبینی شده متصل میشود اما در بافت پویای فیزیولوژیکی رفتار متفاوتی دارد. ادغام پیشبینیهای آلفافولد ۳ با شبیهسازی دینامیک مولکولی یک حوزه فعال توسعه است.
دقت نیز یکسان نیست. آلفافولد ۳ در برخی از کلاسهای هدف به طور قابل توجهی بهتر از سایرین عمل میکند. گیرندههای جفتشده با پروتئین G (GPCRها) — رایجترین کلاس اهداف دارویی — همچنان چالشبرانگیز هستند زیرا انعطافپذیری ساختاری آنها به طور کامل ثبت نمیشود. پروتئینهای ذاتاً بینظم که فاقد ساختار سهبعدی پایدار در شرایط فیزیولوژیکی هستند، ذاتاً در برابر پیشبینی ساختار مقاومند. و دقت پیشبینیهای پروتئین-لیگاند، اگرچه بهتر از ابزارهای قبلی است، همچنان موارد مثبت کاذبی تولید میکند که برای حذف نیاز به اعتبارسنجی فیزیکی دارند.
مسئله دسترسی
یکی از جنبههای پیچیدهتر عرضه آلفافولد ۳، سیاست دسترسی بوده است. سرور آلفافولد برای تحقیقات دانشگاهی غیرتجاری رایگان است، اما وزنهای مدل — که به پژوهشگران امکان میدهد آلفافولد ۳ را به صورت محلی اجرا کرده و در خطوط لوله خودکار ادغام کنند — ابتدا توسط دیپمایند با استناد به نگرانیهای تجاری خودداری شد. این امر باعث واکنش منفی قابل توجهی از سوی جامعه علمی شد که از انتشار باز آلفافولد ۲ استقبال کرده بود.
دیپمایند متعاقباً وزنهای مدل را تحت مجوزی منتشر کرد که استفاده تحقیقاتی غیرتجاری و استقرار محلی را مجاز میدارد، در حالی که استفاده تجاری را محدود میکند. این یک راهحل میانه است که اکثر پژوهشگران دانشگاهی را راضی میکند اما همچنان از سوی مدافعان علم باز که خاطرنشان میکنند آموزش بنیادی آلفافولد به دههها دادههای زیستساختاری با بودجه عمومی متکی بوده است، مورد انتقاد قرار میگیرد.
تأثیر عملی بر جدول زمانی کشف دارو واقعی و قابل اندازهگیری است — نه در چارچوب «فردا سرطان را درمان کنید» که پوشش اولیه را همراهی میکرد، بلکه در فشردهسازی واقعی مراحل شناسایی hit و بهینهسازی lead که از نظر تاریخی سالها کار پیشبالینی را به خود اختصاص میدهد. آنچه آلفافولد ۳ فراهم میکند، قطعیت نیست، بلکه یک نقطه شروع به طور چشمگیری بهتر است — و در کشف دارو، یک نقطه شروع بهتر ارزش بسیار زیادی دارد.