خبر

  • تک بورد - گوگل جزئیات نرم افزار تاشو پروتئین خود را ، دانشگاهیان گزینه دیگری را ارائه می دهند

    گوگل جزئیات نرم افزار تاشو پروتئین خود را ، دانشگاهیان گزینه دیگری را ارائه می دهند
    15 روز و 23 ساعت قبل

    هنگامی که از نظر محاسباتی غیرممکن بود ، اکنون هوش مصنوعی توالی پروتئین را به ساختار ترجمه می کند.
    به لطف توسعه فن آوری تعیین توالی DNA ، بدست آوردن توالی بازهایی که کد کننده یک پروتئین هستند و ترجمه آنها به دنباله آمینواسیدهای سازنده ، بی اهمیت شده است. پروتئین را بالا ببرید اما از آنجا ، ما اغلب گیر می کنیم. عملکرد واقعی پروتئین فقط به طور غیر مستقیم با توالی آن انجام می شود. در عوض ، توالی

    برای دهه ها ، محققان سعی کرده اند نرم افزاری تهیه کنند که بتواند توالی اسیدهای آمینه را بگیرد و ساختار تشکیل آن را به طور دقیق پیش بینی کند. علی رغم اینکه این یک مسئله شیمی و ترمودینامیک است ، ما فقط تا سال گذشته موفقیت محدودی داشته ایم. این زمانی بود که گروه هوش مصنوعی DeepMind گوگل وجود AlphaFold را اعلام کرد ، که به طور معمول می تواند ساختارها را با درجه بالایی از دقت پیش بینی کند.

    در آن زمان ، DeepMind گفت که این اطلاعات به همه جزئیات دستیابی به موفقیت در یک همتای آینده را می دهد. مقاله مرور شده ، که سرانجام دیروز منتشر شد. در این میان ، برخی از محققان دانشگاهی از انتظار خسته شدند ، برخی از بینش های DeepMind را برداشتند و خود را ایجاد کردند. مقاله توصیف این تلاش نیز روز گذشته منتشر شد.

    آلودگی AlphaFold

    DeepMind قبلاً ساختار اساسی AlphaFold را توصیف کرده است ، اما مقاله جدید جزئیات بیشتری را ارائه می دهد. ساختار AlphaFold شامل دو الگوریتم متفاوت است که با توجه به تجزیه و تحلیل آنها به عقب و جلو ارتباط برقرار می کنند و به هر یک اجازه می دهد تا خروجی خود را اصلاح کنند.

    یکی از این الگوریتم ها به دنبال توالی های پروتئینی است که از خویشاوندان تکاملی مورد بحث هستند ، و شکل می گیرد نحوه هماهنگی توالی آنها را تنظیم کنید ، برای تغییرات کوچک یا حتی درج و حذف تنظیم می شود. حتی اگر از ساختار هیچ یک از این اقوام اطلاع نداشته باشیم ، آنها هنوز هم می توانند محدودیت های مهمی ایجاد کنند ، مواردی مانند اینکه آیا بعضی از قسمتهای پروتئین همیشه شارژ می شوند را به ما می گوید.

    تیم AlphaFold می گوید که این بخش از همه چیز برای عملکرد موثر به حدود 30 پروتئین مرتبط نیاز دارد. به طور معمول به سرعت با یک تراز اصلی قرار می گیرد ، سپس آن را اصلاح می کند. این نوع اصلاحات می تواند باعث تغییر شکاف ها به منظور قرار دادن اسیدهای آمینه کلیدی در مکان مناسب شود.

    تبلیغات

    الگوریتم دوم ، که به طور موازی اجرا می شود ، توالی را به قطعات کوچکتر تقسیم می کند و برای حل توالی تلاش می کند. از هر یک از اینها ضمن اطمینان از سازگاری ساختار هر قطعه با ساختار بزرگتر. به همین دلیل هم ترازی پروتئین و بستگان آن ضروری است. اگر اسیدهای آمینه کلیدی در یک قطعه اشتباه قرار بگیرند ، درست شدن ساختار یک چالش واقعی است. بنابراین ، این دو الگوریتم با یکدیگر ارتباط برقرار می کنند و به ساختارهای پیشنهادی اجازه می دهند تا از ترازبندی استفاده کنند.

    پیش بینی ساختاری فرایند دشوارتری است و ایده های اصلی الگوریتم اغلب قبل از حل و فصل الگوریتم ، تغییرات قابل توجه تری را تجربه می کنند ساختار نهایی.

    شاید جالب ترین جزئیات جدید در مقاله جایی باشد که DeepMind از آن عبور می کند و بخشهای مختلف الگوریتمهای تحلیل را غیرفعال می کند. اینها نشان می دهد که از 9 عملکرد متفاوتی که تعریف می کنند ، به نظر می رسد که همه حداقل کمی در دقت نهایی نقش دارند و فقط یکی از آنها تأثیر چشمگیری در آن دارد. این مورد شامل شناسایی نکاتی در ساختار پیشنهادی است که احتمالاً نیاز به تغییر دارد و برای توجه بیشتر آنها را پرچم گذاری می کند.

    رقابت

    در اطلاعیه ای که برای انتشار مقاله منتشر شده است ، مدیر عامل شرکت DeepMind دمیس حسابیس گفت ، "ما متعهد شدیم كه روش های خود را به اشتراک بگذاریم و دسترسی گسترده و رایگان به جامعه علمی را فراهم كنیم. امروز ، ما با به اشتراک گذاشتن کد منبع باز AlphaFold و انتشار متدولوژی کامل سیستم ، اولین قدم را برای تحقق این تعهد برمی داریم." / p>

    اما گوگل قبلاً ساختار اساسی سیستم را توصیف کرده بود ، که باعث شد برخی محققان در دنیای دانشگاه در مورد اینکه آیا می توانند ابزارهای موجود خود را با سیستمی شبیه به ساختار DeepMind سازگار کنند ، فکر کنند. و با تاخیر هفت ماهه ، محققان وقت زیادی برای عمل به این ایده داشتند.

    محققان با استفاده از توصیف اولیه DeepMind پنج ویژگی AlphaFold را شناسایی کردند که به نظر آنها با اکثر روشهای موجود متفاوت است. بنابراین ، آنها سعی کردند ترکیبات مختلفی از این ویژگی ها را پیاده کنند و بفهمند که کدام یک از آنها باعث بهبود روش های فعلی شده است.

    ساده ترین کار برای شروع کار داشتن دو الگوریتم موازی است: یکی اختصاص داده شده برای تراز کردن توالی ها ، سایر پیش بینی های ساختاری اما تیم در پایان بخش ساختاری کارها را به دو عملکرد متمایز تقسیم کرد. یکی از این توابع به سادگی فاصله دو بعدی بین قسمتهای جداگانه پروتئین را تخمین می زند و دیگری مکان واقعی در فضای سه بعدی را کنترل می کند. هر سه آنها اطلاعات را رد و بدل می کنند ، و هر یک از دیگران به این نکته اشاره می کنند که چه مواردی ممکن است به اصلاح بیشتری نیاز داشته باشد.

    تبلیغات

    مشکل با اضافه کردن خط لوله سوم این است که به طور قابل توجهی نیازهای سخت افزاری و دانشگاهیان را افزایش می دهد. به طور کلی به دارایی های محاسباتی مشابه DeepMind دسترسی ندارید. بنابراین ، در حالی که این سیستم به نام RoseTTAFold از نظر صحت پیش بینی های خود عملکرد AlphaFold را به خوبی نداشت ، اما از هر سیستم قبلی که تیم می توانست آزمایش کند ، بهتر بود. اما ، با توجه به سخت افزاری که روی آن اجرا شد ، سرعت آن نیز نسبتاً سریع بود و با استفاده از پروتئینی که 400 اسید آمینه دارد ، 10 دقیقه طول می کشد.

    مانند AlphaFold ، RoseTTAFold پروتئین را به قطعات کوچکتر تقسیم می کند و قبل از تلاش برای ایجاد یک ساختار کامل ، آنها را به صورت جداگانه حل می کند. در این حالت ، تیم تحقیق متوجه شدند که این ممکن است یک برنامه کاربردی اضافی داشته باشد. بسیاری از پروتئین ها برای کار کردن با سایر پروتئین ها فعل و انفعالات گسترده ای ایجاد می کنند - به عنوان مثال هموگلوبین به عنوان یک مجموعه چهار پروتئین وجود دارد. اگر این سیستم آنطور که باید کار کند ، با تغذیه دو پروتئین متفاوت باید به آن اجازه دهد که هم ساختار خود را مشخص کند و هم مکانی که با یکدیگر تعامل دارند. آزمایشات انجام شده نشان داد که واقعاً م worksثر است.

    رقابت سالم

    به نظر می رسد هر دو مقاله تحولات مثبتی را توصیف می کنند. برای شروع ، تیم DeepMind شایسته اعتبار کامل برای بینش هایی است که در وهله اول در مورد ساختار سیستم خود داشته است. واضح است که تنظیم امور به عنوان فرآیندهای موازی که با یکدیگر ارتباط برقرار می کنند ، جهش بزرگی در توانایی ما برای تخمین ساختارهای پروتئینی ایجاد کرده است. تیم آکادمیک ، به جای اینکه صرفاً سعی در بازتولید آنچه DeepMind انجام داده است ، فقط برخی از بینش های اصلی را اتخاذ کرده و آنها را به مسیرهای جدیدی هدایت کرده است. دقت خروجی نهایی آنها و از نظر زمان و منابع محاسبه شده که باید به آن اختصاص یابد. اما به نظر می رسد که هر دو تیم به صراحت متعهد هستند ، این احتمال وجود دارد که بهترین ویژگی های هر یک از طرف دیگر باشد.

    نتیجه هرچه باشد ، ما به وضوح در مکان جدیدی نسبت به جایی که بودیم قرار داریم. همین چند سال پیش چندین دهه است که افراد سعی در حل پیش بینی های ساختار پروتئین دارند و ناتوانی ما در انجام این کار در زمانی که ژنوم ها مقادیر گسترده ای از توالی پروتئین را در اختیار ما قرار می دهند ، مسئله سازتر می شود که ایده چندانی برای تفسیر آنها نداریم. تقاضای زمان برای این سیستم ها به احتمال زیاد زیاد خواهد بود ، زیرا بخش بزرگی از جامعه تحقیقات زیست پزشکی از این نرم افزار بهره مند می شوند.

    Science، 2021. DOI: 10.1126 / science.abj8754

    Nature، 2021. DOI: 10.1038 / s41586-021-03819-2 (درباره DOI).





خبرهای دیگر از علوم پایه