Российские биоинформатики предложили новую архитектуру нейронной сети, которая способна предсказать, насколько точно выбрана РНК, нацеливающая на редактируемый ген РНК в популярном методе редактирования генома CRISPR/Cas. Результаты работы, выполненной при поддержке гранта Российского научного фонда, опубликованы в журнале Nucleic Acids Research. Кратко о них рассказала пресс-служба фонда.
В природе система CRISPR/Cas служит для защиты бактерий от вирусов. При заражении геном вируса оказывается внутри бактериальной клетки, но поскольку его последовательности отличаются от бактериального генома, Cas-белки распознают вирусный геном как чужеродный и разрезают его. Чтобы в дальнейшем бактерия могла быстрее среагировать на вирус, фрагменты ДНК вируса сохраняются в клетке — почти как база вирусных сигнатур в компьютерном антивирусе. Они передаются из поколения в поколение и используются Cas-белками для защиты от новых вторжений.
В 2011–2013 годах ученые из разных лабораторий мира (Д. Даудна, Э. Шарпентье, Ф. Джанг в США и В. Шикснис в Литве) независимо друг от друга смогли адаптировать систему CRISPR/Cas к изменению произвольных последовательностей ДНК в клетках человека и животных, сделав редактирование генома значительно проще и эффективнее. Ключевые элементы технологии — гидовая, или наводящая, РНК и белок Cas9, который разрезает ДНК в месте, соответствующем ее последовательности. Затем клетка «залечит» разрез, но изменения уже будут внесены. Однако наводящая РНК не всегда попадает в нужное место и может неверно направить «генетические ножницы» Cas9.
Ученые из Сколтеха под руководством Константина Северинова применили глубокое обучение, гауссовские процессы и другие методы, чтобы решить проблему более точного выбора оптимальных наводящих РНК. Результатом стал набор нейросетей, которые представляют собой математические модели, реализованные в виде последовательных умножений матриц — больших наборов чисел со сложной внутренней структурой. Нейросеть способна к обучению благодаря наличию «памяти», определенным образом изменяемой каждый раз, когда система считает в режиме тренировки. Модели были обучены на разных наборах данных, содержащих десятки тысяч экспериментально подтвержденных гидовых РНК, с высокой точностью сработавших на клетках человека и других животных.
Алгоритм, предложенный учеными из Сколтеха, оценивает вероятности разрезания ДНК-мишеней в правильном месте для заданных гидовых РНК. На это можно ориентироваться при выборе инструмента редактирования в любой технологии, основанной на CRISPR/Cas. Ученые уже предложили заранее рассчитанный их нейросетью набор гидовых последовательностей РНК, позволяющих точно изменять гены 22-й хромосомы человека. Это стало возможным благодаря точности предсказания частоты разрезания и добавлению оценки погрешности, которую не предоставлял ни один ранее разработанный для решения такой задачи метод.
«Результаты нашей работы могут быть применимы в любом приложении технологий, которые основаны на CRISPR/Cas, будь то терапия генетических заболеваний, агротехнологии или эксперименты в фундаментальных научных исследованиях», — рассказывает аспирант Сколтеха Богдан Кириллов, один из создателей нового метода и первый автор статьи.
По материалам: polit