страница_баннер

новости

Премия Ласкера за фундаментальные медицинские исследования в этом году была присуждена Демису Хассабису и Джону Джамперу за их вклад в создание системы искусственного интеллекта AlphaFold, которая предсказывает трехмерную структуру белков на основе последовательности аминокислот первого порядка.

 

Их результаты решают проблему, которая долгое время волновала научное сообщество, и открывают путь к ускорению исследований в области биомедицины. Белки играют ключевую роль в развитии заболеваний: при болезни Альцгеймера они сворачиваются и слипаются; при раке их регуляторная функция утрачивается; при врожденных нарушениях обмена веществ они дисфункциональны; при муковисцидозе они занимают неподходящее место в клетке. Это лишь некоторые из многочисленных механизмов, вызывающих заболевания. Подробные модели структуры белков могут предоставить данные об атомных конфигурациях, способствовать разработке или отбору высокоаффинных молекул и ускорить разработку лекарственных препаратов.

 

Структуры белков обычно определяются методами рентгеновской кристаллографии, ядерного магнитного резонанса и криоэлектронной микроскопии. Эти методы дороги и требуют много времени. В результате существующие базы данных трехмерных структур белков содержат всего около 200 000 структурных данных, в то время как технология секвенирования ДНК дала более 8 миллионов белковых последовательностей. В 1960-х годах Анфинсен и др. обнаружили, что одномерная последовательность аминокислот может спонтанно и многократно складываться в функциональную трехмерную конформацию (рисунок 1А), и что молекулярные «шапероны» могут ускорять и облегчать этот процесс. Эти наблюдения привели к 60-летней задаче в молекулярной биологии: предсказанию трехмерной структуры белков по одномерной последовательности аминокислот. С успехом проекта «Геном человека» наши возможности получения одномерных аминокислотных последовательностей значительно улучшились, и эта задача стала еще более актуальной.

ST6GAL1-белковая-структура

Предсказывать структуру белков сложно по нескольким причинам. Во-первых, все возможные трёхмерные положения каждого атома в каждой аминокислоте требуют обширных исследований. Во-вторых, белки максимально используют комплементарность своей химической структуры для эффективной конфигурации атомов. Поскольку белки обычно имеют сотни «доноров» водородных связей (обычно кислород), которые должны располагаться вблизи «акцептора» водородной связи (обычно азота, связанного с водородом), может быть очень сложно найти конформации, в которых почти каждый донор находится вблизи акцептора. В-третьих, существует ограниченное количество примеров для обучения экспериментальным методам, поэтому необходимо понимать потенциальные трёхмерные взаимодействия между аминокислотами на основе одномерных последовательностей, используя информацию об эволюции соответствующих белков.

 

Физика была впервые использована для моделирования взаимодействия атомов в поиске наилучшей конформации, и был разработан метод прогнозирования структуры белков. Карплус, Левитт и Варшел были удостоены Нобелевской премии по химии 2013 года за свою работу по компьютерному моделированию белков. Однако методы, основанные на физике, требуют больших вычислительных затрат и приблизительной обработки, поэтому невозможно предсказать точные трехмерные структуры. Другой подход, основанный на знаниях, заключается в использовании баз данных известных структур и последовательностей для обучения моделей с помощью искусственного интеллекта и машинного обучения (ИИ-МО). Хассабис и Джампер применяют элементы как физики, так и ИИ-МО, но инновационность и скачок производительности этого подхода обусловлены прежде всего ИИ-МО. Два исследователя творчески объединили большие общедоступные базы данных с промышленными вычислительными ресурсами для создания AlphaFold.

 

Откуда мы знаем, что они «решили» загадку структурного предсказания? В 1994 году был учрежден конкурс «Критическая оценка предсказания структуры» (CASP), который проводится каждые два года для отслеживания прогресса в области структурного предсказания. Исследователи поделятся одномерной последовательностью белка, структуру которого они недавно определили, но результаты исследования ещё не опубликованы. Предсказатель предсказывает трёхмерную структуру, используя эту одномерную последовательность, а оценщик независимо оценивает качество предсказанных результатов, сравнивая их с трёхмерной структурой, предоставленной экспериментатором (предоставленной только оценщику). CASP проводит слепые проверки и регистрирует периодические скачки производительности, связанные с методологическими инновациями. На 14-й конференции CASP в 2020 году результаты предсказания AlphaFold показали такой скачок производительности, что организаторы объявили о решении проблемы трёхмерного предсказания структуры: точность большинства предсказаний была близка к точности экспериментальных измерений.

 

Более широкое значение заключается в том, что работа Хассабиса и Джампера убедительно демонстрирует, как искусственный интеллект и машинное обучение могут преобразовать науку. Исследование показывает, что искусственный интеллект и машинное обучение способны строить сложные научные гипотезы на основе данных из нескольких источников, что механизмы внимания (аналогичные тем, что используются в ChatGPT) способны обнаруживать ключевые зависимости и корреляции в источниках данных, и что искусственный интеллект и машинное обучение способны самостоятельно оценивать качество получаемых результатов. По сути, искусственный интеллект и машинное обучение занимаются наукой.


Время публикации: 23 сентября 2023 г.