МАШИННОЕ ОБУЧЕНИЕ ДЛЯ ПРЕДСКАЗАНИЯ ФУНКЦИЙ БЕЛКА


Ученые из США создали модель машинного обучения CLEAN (contrastive learning-enabled enzyme annotation), которая способна предсказать функцию фермента и в настоящее время превосходит все существующие подобные инструменты. Авторы экспериментально подтвердили предсказанные функции 36 ферментов, и точность предсказаний оказалась очень высокой. Модель CLEAN потенциальна будет крайне полезна для реализации самых разных проектов в области геномики, синтетической биологии и биокатализа.

Благодаря постоянно растущим геномным и метагеномным базам данных у современных ученых в распоряжении становится все больше информации о белковых последовательностях в то время, как знания о функциональных свойствах белков, в том числе ферментов, приходится зачастую получать только экспериментальным путем. С другой стороны, возможность на основе структуры белка судить о потенциале его применения могла бы заметно ускорить процесс разработки новых биотех-продуктов. Надеясь обойти ограничения существующих подходов, Tianhao Yu et al. из Университета Иллинойса разработали модель машинного обучения, основанную на контрастном обучении и названную CLEAN. С ее помощью удалось с высокой точностью определять номер ЕС фермента (enzyme commission number), что особенно актуально для мало изученных белков или белков с множественной активностью (катализирующих несколько реакций). Номер ЕС присваивается ферментам в зависимости от того, какие реакции они могут ускорять.

Представленная командой ученых система CLEAN превзошла по эффективности и надежности разработанный ранее инструмент BLASTp в экспериментах in silico и in vitro. В будущем она сможет заметно облегчить путь развития самых разных областей науки, включая молекулярный инжиниринг и биокатализ.

 

Источник: https://www.science.org