ГлавнаяТехнологииРоссийская нейросеть научилась расшифровывать геномы
Технологии

Российская нейросеть научилась расшифровывать геномы

Исследователи из института AIRI представили инструмент GENATATOR, способный автоматически размечать гены в цепочках ДНК. В отличие от традиционных алгоритмов, жестко привязанных к конкретным правилам, система опирается на машинное обучение, что позволяет ей находить скрытые структуры даже в геномах малоизученных организмов, где отсутствуют привычные генетические маркеры.

Российская нейросеть научилась расшифровывать геномы

Разработка анализирует последовательность поэтапно: сначала определяет границы участков, затем проверяет их структуру и классифицирует, отделяя экзоны от интронов. Такой подход позволяет нейросети распознавать не только белок-кодирующие фрагменты, но и сложные для анализа гены длинных некодирующих РНК. Точность здесь критична, ведь ошибка даже в один нуклеотид искажает структуру белка из-за сдвига рамки считывания.

Технология особенно эффективна для работы с «немодельными» организмами, чьи геномы часто представлены лишь «сырыми» данными без аннотаций. Во время испытаний модель, обученная на генах человека и 38 видов млекопитающих, успешно справилась с анализом ДНК плодовой мушки, дрожжей и растений. Система также научилась выявлять редкие «ядовитые» экзоны, провоцирующие деградацию РНК. Сейчас разработчики открыли доступ к модели на платформе Hugging Face и запустили лидерборд для сравнения результатов с другими решениями.

Комментарии (0)

Оставить комментарий

Пока нет комментариев. Будьте первым!