На края на всяка година списание Science определя кои са били най-значимите открития. Правят и допитване до читателите си. Мненията на редакцията и на читателите съвпадат за първи път от 2018 г.
Открояват се трима финалисти:
1. Използването на ДНК в древна кал (вече няма нужда из пещерите да се търси зъбче или костичка за ДНК анализ, достатъчно е да се гребне малко пещерна кал, и от анализа на ДНК в нея ще се научат неща за отдавнашни обитатели на древни пещери, за диетата им и прочее); (Повече информация "Извлечена е ДНК на древни хора за първи път от пещерни почви".
2. Успешното прилагане на генното редактиране чрез CRISPR на място в човешкото тяло за лекуване на наследствени болести (сърповидна анемия и бета-таласемия ("Генни терапии за лекуване на сърповидно-клетъчна анемия и бета-таласемия") транстиретин (TTR) амилоидоза (Генна терапия с CRISPR чрез трансфузия на РНК в кръвта); зрителен дефект Лебер конгенитална амауроза 10);
3. Удивително точно предсказване на белтъчни структури с помощта на методики на изкуствен интелект.
Първо място спечелва изкуственият интелект (ИИ) – за най-впечатляващото завоевание: Не само за предсказване на белтъчни структури, но и за намиране на начина, по който те си взаимодействат и образуват комплекси. Последната „черешка“ върху тортата е статия в сп. Nature от 16 декември 2021, в която се описва как с ИИ може да се конструират нови белтъци като се използува метода на „халюцинация“, използуващ платформи нa Google DeepDream за трениране при разпознаване на лица.
Изкуственият Интелект предсказва как два белтъка образуват комплекс, извършващ поправки на ДНК при дрожди
CREDIT: I. R. HUMPHREYS ET AL., SCIENCE 374, 6573, EABM4805 (2021) DOI:10.1126/SCIENCE.ABM4805
Историята на белтъчните структури започва с разшифроване на рентгеновата кристалограма на миоглобина, за което Макс Перуц и Джон Кендрю получават Нобелова награда. Не дълго след това Кристиян Анфинсен установи, че може да развали, а след това да се възстанови, пространствената структура и биохимична активност на ензима рибонуклеаза. От това следва важното заключение, че за правилното загъване на белтъка в пространството е нужна само неговата първична структура - последователността от аминокиселини по полипептидната верига. Това реопаковане става бързо - за няколко микро до милисекунди. Крайната стабилна структура е в оптимален енергетичен минимум.
Досега са открити експериментално структурите на 185000 белтъци, като за целта те се кристализират и облъчват с рентгенови лъчи. Кристализирането е трудоемък процес. На помощ идва методът на криоелетронната микроскопия, при който не е нужна кристализация, но затова пък се използва много скъп инструментариум. Изправени пред милионите белтъци, които съществуват в живия свят, трябва да се търси друго решение като се предсказва структурата на белтъка по неговата първична последователност от аминокиселини.
Още преди половин век започват опитите за намиране на пространствената структура на белтъци чрез моделиране с помощта на компютри. Варирайки торсионните ъгли по полипетидната верига и по страничните вериги на аминокиселинните остатъци компютърът оптимизира енергията в търсене на минимум. Но да се намери бързо глобалния минимум на една функция с много променливи е невъзможно, поради това че има множесто локални минимуми и програмата не може да знае как да иде пряко към „заветния“ глобален минимум. Изчислено е, че за да се „прогонят“ всички възможности и се стигне до оптималната струкура няма да стигне и времето от началото на Вселената. Това е така наречения парадокс на Левинтал.
А как природата успява да направи това за милисекунди?! В периода на биологичната еволюция, използувайки случайни мутации, белтъците са усъвършенствали първичната си структура така, че да заемат функционираща пространствена сглобка. Те са, по думите на известния теоретик О. Б. Птицин, еволюционно-отредактирани биополимери.
От начало компютърните методи нямат висока предсказателна способност. Дори след внасяне на информация за структурните мотиви при вече известните структури, за да се подскаже при търсене на неизвестна структура, успехът не е повече от 60%. С използуване на еволюционни съображения при сравнение на сродни белтъци този процент стига 70.
Към 2018 т. белтъчните „моделиери“ започват да прилагат програми основани на Изкуствения Интелект (ИИ) и невронни мрежи. Дъщерната фирма на Гугъл – DeepMind тренира върху известни белтъчни структури за да използва това при търсене на неизвестна структура, в която се срещат сходни пептидни мотиви.
Към 2020 г. AlphaFold2 използва мрежа от 182 процесора, оптимизирани за машинно обучение, и достига точност 92.4% сравнима с екперименталните техники. Тази година с използване на ИИ групата на Дейвид Бейкър от Института по проектиране на белтъци на Вашингтонския Университет, с използуване на усъвършенстван софтуер RoseTTAFold и Alphafold na Deepmind предсказват структурата на хиляди белтъци. След това проверяват с компютъра кои от тези белтъци могат да образуват комплекси.
Това в последствие може да се проверява по екпериментален път.
Софтуерът на АlfaFold2 и roseTTAFold е публично достъпен за всеки, който иска да проектира нов белтък или да намери структурата на белтък с известна първична последователност. През ноември учени от Германия и САЩ използуват този софтуер, както и криоелектронна микроскопия, за да картират структурата на комплекс, образуващ клетъчна ядрена пора. Той се състои от 30 различни белтъци, които контролират достъпа до клетъчното ядро. Същият метод позволява да се търсят нови лекарства.
Дейвид Бейкър ръководи Института по Проектиране на Белтъци с неговите 130 сътрудници.
Кредит: Ian C. Haydon/IPD
Какво ще стане ако се използува обратен подход - от третичната (пространствена) структура към възможни първични структури, които да доведат до подобна тримерна опаковка. Такъв метод е удобен за проектиране на нови белтъци.
Това е демонстрирано в декемврийската статия на Иван Анишченко и сътр. от Института на Бейкър.
„Ние започнахме от една напълно случайна пептидна последователност и внасяхме мутации докато нашата невронна мрежа предскаже, че те могат да се загънат в стабилна структура“ - казва Анишченко.
Иван Анищченко, постдок в И-тута за Белтъчно проектиране в Университета Вашингтон. Кредит: UW IPD Photo
Такъв начин на търсене прилича на играта на „топло/студено“ = „прилича/не прилича“ на структуриран белтък. И ако подбраният белтък се произведе „в епруветка“, експериментално ще може да се е подтвърди резултатът от моделирането. Такъв подход изследователският тим нарича „халюцинация“ на белтъци.
Терминът "халюцинация" се използва във връзка с разработка на ИИ тима на Гугъл. Започвайки от образ със случайни (рандомизирани) пиксели невронните мрежи, тренирани да разпознават например плод, се „запитват“ доколко образът прилича на банан? След поредни пробвания въпросът се задава отново и отново, всяка промяна се запазва, стига да засилва „банано-подобните“ характеристики. Процесът се повтаря хилядократно. Крайният резултат е явно банано-подобен, но прилича повече на картина в стил ала кубизъм или импресионизъм, сякаш художникът е приемал халюциноген. (по Джон Тимър - Getting software to “hallucinate” reasonable protein structures, ArsTechnica)
Случаен шум(вляво) преминава в бананоподобни халюцинация(вдясно) чрез повторни търсенета с бананоразпознаващия изкуствен интелект (ИИ).
Кредит: photo Google
Софтуерът халюцинира приемливи белтъчни структури. Итеративно проверява дали „това прилича на белтък“. В компютърния модел чрез мутиране на случайно аминокиселини по дължината на полипептидната верига се следи дали това води до по-структуриран белтък. Тогава се прави следваща мутация и така в 20 хиляди итеративни стъпки. В резултат учените намират 129 нови белтъци, със структури подобни на белтъци, срещани в природата. За да се проверят така моделираните нови структури, учените синтезират тези белтъци в чревната бактерия Ешерихия Коли в лаборатория и намират, че 27 от тях съвпадат по пространствена структура с предсказаните структури.
Ето как изглежда една от новопроектираните халюцинирани от софтуера структури, сравнена с експерименталния кристалографски резултат.
Сравнение на „халюцинирана“ структура (в синьо) спрямо кристалната (в сиво). Вдясно долу са показани и страничните аминокиселинни вериги. Фиг. по Anishchenko, I. и сътр.
Комбинирането на предсказване на белтъчната струтура с дълбоко обучение с методите на ИИ открива нови възможности при проектирането на белтъци. Ето какво казва Дейвид Бейкър, който получава наградата на сп. Сайънс за водещо откритие:
“Използуването на задълбочено обучение (deep learning) на невронните мрежи, които са се самотренирали върху общите структурни принципи за построяване на белтъчни структури дава възможност да се фокусираме пряко върху функционалните части на нови белтъци с оглед на специфични приложения.“
Credit: Alecsandra Dragoi for Nature
Списанието Nature също има класация – на най-заслужилите учени през годината. В декемврийския брой на списанието един от тях
е Джон Джъмпър (John Jumper). Той ръководи тима в компанията DeepMind, създала инструмента AlphaFold2, който използа ИИ методи и невронни мрежи, за които споменахме по-горе, и предсказва структурата на белтъци с феноменална точност, превъзхождайки всички подобни конкуретни подходи. През юли Джъмпър обнародва софтуера си и заедно с Европейската лаборатория по молекулярна биология предсказват структурите на всички белтъци, срещани при хората и 20 други моделни организми - общо 250000.
Планът им е до края на идната година да предскажат структурата на половината от всички известни белтъци, които са около 130 милиона. Това ще е тържество на човешкия и изкуствения интелект. Проблемът със предсказване на структурата на белтъците вече на практика не съществува.
Върхово постижение с помощта на AlphaFold2 e намиране на структурата на ядрената пора на еукариотната клетка. Тя се състои от 30-тина различни белтъци в сложен комплекс общо на хиляда белтъчни вериги клетка.
“Така софтуерът променя работата на експериментаторите, това е забележителен успех", казва Джъмпър.
(по News Feature Nature 15 December 2021 Nature ’s 10: ten people who helped shape science in
2021 )
***
Използвана литература: Anishchenko, I., Pellock, S.J., Chidyausiku, T.M. et al. De novo protein design by deep network hallucination. Nature 600, 547–552 (2021). https://doi.org/10.1038/s41586-021-04184-w
Авторът Константин Чипев е молекулярен и клетъчен биолог от Университета Стони Брук в Ню Йорк.
Коментари
Моля, регистрирайте се от TУК!
Ако вече имате регистрация, натиснете ТУК!
Няма коментари към тази новина !
Последни коментари