Новый инструмент искусственного интеллекта может помочь исследователям обнаружить ранее неизвестные белки и разработать совершенно новые. При использовании это может помочь в разработке более эффективных вакцин, ускорить исследования по излечению от рака или привести к совершенно новым материалам.
Как сообщает MIT Technology Review, эта разработка может помочь в создании новых лекарств и материалов.
Новый алгоритм получил название ProteinMPNN. Обычно ученые создают новые белки, модифицируя те, которые встречаются в природе. Но создание ProteinMPNN открывает перед исследователями перспективу создания соединений с нуля.
«В природе белки решают практически все проблемы жизни, начиная от сбора энергии солнечного света и заканчивая созданием молекул. Все в биологии происходит из белков. Они развивались в ходе эволюции, чтобы решать проблемы, с которыми организмы сталкивались в ходе эволюции. Но сегодня мы сталкиваемся с новыми проблемами, такими как COVID-19. Если бы мы могли разработать белки, которые были бы так же хороши для решения новых проблем, как те, которые появились в ходе эволюции, решают старые проблемы, это было бы очень, очень мощно», — заявил Дэвид Бейкер, один из авторов статьи и директор Института белкового дизайна Вашингтонского университета.
Белки состоят из десятков тысяч аминокислот, которые связываются в длинные цепи, образуя трехмерные структуры. AlphaFold, который был представлен в 2020 году, помогает исследователям прогнозировать структуру, давая представление о том, как она будет себя вести.
А вот ProteinMPNN может помочь решить обратную задачу: если ученые уже знают будущую структуру белка, алгоритм поможет им определить правильную последовательность аминокислот. В основе разработки лежит нейросеть, обученная на большом количестве аминокислот, которые складываются в трехмерные структуры.
Но ученым нужно решить и другую проблему: чтобы создавать белки, полезные в реальной жизни, необходимо выяснить, какой белковый остов будет выполнять необходимую функцию. И исследователи смогли справиться с этой задачей, объединив два метода машинного обучения.