mRNA-GPT: ИИ-генератор Sanofi переписывает правила создания мРНК-терапии

Программируемая биология: как генеративные модели превращают дизайн лекарств в вычислительную задачу

Исследовательская группа Sanofi R&D под руководством Sven Jager представила mRNA-GPT — первую в своем роде генеративную модель для сквозного дизайна полноразмерных последовательностей матричной РНК. В отличие от классических методов оптимизации кодонов, система осуществляет комплексное проектирование всех трех функциональных областей (5' UTR, CDS и 3' UTR), учитывая сложные пространственные взаимодействия и долгосрочные зависимости внутри цепи. Это знаменует фундаментальный переход индустрии от метода проб и ошибок к прецизионному цифровому конструированию программируемых лекарств с заданными параметрами стабильности, трансляции и иммунной безопасности.

ученый-биоинформатик анализирует 3D-структуру мРНК на экране, применяя генеративный ИИ mRNA-GPT для проектирования терапевтических последовательностей
mRNA-GPT превращает разработку мРНК в вычислительную задачу — быстрее, точнее и с предсказуемым результатом.

Развитие мРНК-медицины, получившее мощный импульс благодаря успеху вакцин против COVID-19, столкнулось с серьезным барьером: чувствительностью терапевтической эффективности к малейшим изменениям в структуре всей транскрипта. Sizhen Li и его коллеги из Sanofi R&D указывают, что существующие подходы к дизайну зачастую фрагментарны. Традиционно исследователи оптимизируют кодирующую последовательность (CDS) отдельно от нетранслируемых областей (UTR), что ведет к потере критически важных регуляторных взаимодействий.

Модель mRNA-GPT базируется на архитектуре GPT-2 и была предварительно обучена на колоссальном массиве данных — 30 миллионах натуральных последовательностей мРНК из базы NCBI RefSeq. Такая база позволяет ИИ улавливать биологические закономерности, накопленные эволюцией, и использовать их для генерации синтетических структур, превосходящих природные аналоги по функциональности.

«Мы переходим к парадигме, где ИИ становится не просто инструментом анализа, а полноценным архитектором молекул. mRNA-GPT способна проектировать терапию под конкретный белок за считанные часы, обеспечивая баланс между стабильностью РНК и скоростью синтеза целевого протеина», — подчеркивают авторы исследования.

Технологический стек: от токенизации до обучения с подкреплением

Для достижения высокой точности дизайна команда Sanofi внедрила ряд инновационных решений в архитектуру модели. Обучение велось с использованием специфических механизмов, адаптированных под нужды молекулярной биологии:

  • Двухуровневое эмбеддирование: Модель одновременно обрабатывает как нуклеотидные последовательности РНК, так и соответствующие им аминокислотные последовательности белков, что гарантирует точное соответствие дизайна целевой мишени.
  • Специализированная токенизация: Использование метода Byte-Pair Encoding (BPE) позволило сжать сотни нуклеотидов в компактные субворд-токены, что критически важно для обработки длинных РНК-цепей в рамках фиксированного контекстного окна модели.
  • Итеративная оптимизация: Применение алгоритма Proximal Policy Optimization (PPO) в связке с предсказательными моделями (оракулами), такими как Saluki для оценки стабильности и mRNA-LM для прогнозирования эффективности трансляции.

Важнейшим аспектом является гибкость системы. mRNA-GPT поддерживает три режима генерации: создание отдельных регионов (только UTR или только CDS), полную сборку последовательности «с нуля» или условную генерацию, когда одна область проектируется на основе уже существующих параметров других регионов.

Multi-Objective Optimization: преодоление Парето-барьеров

Одной из главных проблем в дизайне РНК является антагонизм свойств: например, повышение стабильности молекулы часто ведет к замедлению процесса трансляции белка. Michael Bailey и команда разработчиков решили эту задачу через многокритериальную оптимизацию. Модель обучается находить Парето-оптимальные решения — такие конфигурации, при которых ни один из параметров нельзя улучшить без деградации другого.

В ходе экспериментов по оптимизации 3' UTR для повышения стабильности было обнаружено, что mRNA-GPT интуитивно увеличивает содержание цитозина и снижает долю гуанина. Это соответствует известным биологическим механизмам предотвращения экзонуклеазного распада и исключения образования G-квадруплексов, которые могут привлекать дестабилизирующие факторы.

Анализ показал, что модель не просто копирует природные паттерны, а активно исследует пространство синонимичных последовательностей, создавая уникальные конструкции с высокой термодинамической стабильностью (MFE), превосходящие результаты специализированных алгоритмов, таких как LinearDesign.

Портфель применений и рыночный ландшафт

Появление mRNA-GPT создает мощный рычаг для компаний, формирующих Портфель разработок в области мРНК-терапии. Основные направления применения включают:

  • Онкологические вакцины: Быстрая генерация неоантигенов для персонализированной терапии рака.
  • Заместительная терапия белками: Создание высокоэффективных инструкций для синтеза ферментов или антител непосредственно в клетках пациента.
  • Доставка CRISPR-систем: Оптимизация мРНК, кодирующих нуклеазы, для максимально эффективного редактирования генома с минимальным иммунным ответом.

Конкурентная среда в этом сегменте стремительно уплотняется. Лидеры рынка, такие как Moderna и BioNTech, также активно интегрируют ИИ в свои НИОКР, однако подход Sanofi к сквозному дизайну полноразмерных цепей дает серьезное преимущество в скорости прохождения доклинических этапов. Это позволяет радикально сократить Капитальные затраты на итеративные лабораторные тесты.

Синтез от АПТЕКИУМ: mRNA-GPT — это не просто технологический апгрейд, а рождение «ChatGPT для лекарств». Если раньше создание мРНК-конструкции требовало месяцев эмпирической валидации, то теперь мы вступаем в эпоху программируемой биологии, где цифровая последовательность становится гарантированным рецептом терапевтического успеха. Для Большой фармы это означает обнуление старых методологий и переход к мобилизационному сценарию внедрения генеративного ИИ во все звенья создания лекарств.

18+Для профессионального сообщества:

Данная публикация предназначена для специалистов здравоохранения и участников фармрынка. Аналитические выводы редакции носят информационный характер и не являются призывом к самолечению или заменой очной консультации врача. При работе с лекарственными препаратами необходимо руководствоваться официальной инструкцией и мнением профильного специалиста. Полный текст дисклеймера.

Новые Старые

نموذج الاتصال