Программируемая биология: как генеративные модели превращают дизайн лекарств в вычислительную задачу
Исследовательская группа Sanofi R&D под руководством Sven Jager представила mRNA-GPT — первую в своем роде генеративную модель для сквозного дизайна полноразмерных последовательностей матричной РНК. В отличие от классических методов оптимизации кодонов, система осуществляет комплексное проектирование всех трех функциональных областей (5' UTR, CDS и 3' UTR), учитывая сложные пространственные взаимодействия и долгосрочные зависимости внутри цепи. Это знаменует фундаментальный переход индустрии от метода проб и ошибок к прецизионному цифровому конструированию программируемых лекарств с заданными параметрами стабильности, трансляции и иммунной безопасности.
![]() |
| mRNA-GPT превращает разработку мРНК в вычислительную задачу — быстрее, точнее и с предсказуемым результатом. |
Развитие мРНК-медицины, получившее мощный импульс благодаря успеху вакцин против COVID-19, столкнулось с серьезным барьером: чувствительностью терапевтической эффективности к малейшим изменениям в структуре всей транскрипта. Sizhen Li и его коллеги из Sanofi R&D указывают, что существующие подходы к дизайну зачастую фрагментарны. Традиционно исследователи оптимизируют кодирующую последовательность (CDS) отдельно от нетранслируемых областей (UTR), что ведет к потере критически важных регуляторных взаимодействий.
Модель mRNA-GPT базируется на архитектуре GPT-2 и была предварительно обучена на колоссальном массиве данных — 30 миллионах натуральных последовательностей мРНК из базы NCBI RefSeq. Такая база позволяет ИИ улавливать биологические закономерности, накопленные эволюцией, и использовать их для генерации синтетических структур, превосходящих природные аналоги по функциональности.
«Мы переходим к парадигме, где ИИ становится не просто инструментом анализа, а полноценным архитектором молекул. mRNA-GPT способна проектировать терапию под конкретный белок за считанные часы, обеспечивая баланс между стабильностью РНК и скоростью синтеза целевого протеина», — подчеркивают авторы исследования.
Технологический стек: от токенизации до обучения с подкреплением
Для достижения высокой точности дизайна команда Sanofi внедрила ряд инновационных решений в архитектуру модели. Обучение велось с использованием специфических механизмов, адаптированных под нужды молекулярной биологии:
- Двухуровневое эмбеддирование: Модель одновременно обрабатывает как нуклеотидные последовательности РНК, так и соответствующие им аминокислотные последовательности белков, что гарантирует точное соответствие дизайна целевой мишени.
- Специализированная токенизация: Использование метода Byte-Pair Encoding (BPE) позволило сжать сотни нуклеотидов в компактные субворд-токены, что критически важно для обработки длинных РНК-цепей в рамках фиксированного контекстного окна модели.
- Итеративная оптимизация: Применение алгоритма Proximal Policy Optimization (PPO) в связке с предсказательными моделями (оракулами), такими как Saluki для оценки стабильности и mRNA-LM для прогнозирования эффективности трансляции.
Важнейшим аспектом является гибкость системы. mRNA-GPT поддерживает три режима генерации: создание отдельных регионов (только UTR или только CDS), полную сборку последовательности «с нуля» или условную генерацию, когда одна область проектируется на основе уже существующих параметров других регионов.
Multi-Objective Optimization: преодоление Парето-барьеров
Одной из главных проблем в дизайне РНК является антагонизм свойств: например, повышение стабильности молекулы часто ведет к замедлению процесса трансляции белка. Michael Bailey и команда разработчиков решили эту задачу через многокритериальную оптимизацию. Модель обучается находить Парето-оптимальные решения — такие конфигурации, при которых ни один из параметров нельзя улучшить без деградации другого.
В ходе экспериментов по оптимизации 3' UTR для повышения стабильности было обнаружено, что mRNA-GPT интуитивно увеличивает содержание цитозина и снижает долю гуанина. Это соответствует известным биологическим механизмам предотвращения экзонуклеазного распада и исключения образования G-квадруплексов, которые могут привлекать дестабилизирующие факторы.
Анализ показал, что модель не просто копирует природные паттерны, а активно исследует пространство синонимичных последовательностей, создавая уникальные конструкции с высокой термодинамической стабильностью (MFE), превосходящие результаты специализированных алгоритмов, таких как LinearDesign.
Портфель применений и рыночный ландшафт
Появление mRNA-GPT создает мощный рычаг для компаний, формирующих Портфель разработок в области мРНК-терапии. Основные направления применения включают:
- Онкологические вакцины: Быстрая генерация неоантигенов для персонализированной терапии рака.
- Заместительная терапия белками: Создание высокоэффективных инструкций для синтеза ферментов или антител непосредственно в клетках пациента.
- Доставка CRISPR-систем: Оптимизация мРНК, кодирующих нуклеазы, для максимально эффективного редактирования генома с минимальным иммунным ответом.
Конкурентная среда в этом сегменте стремительно уплотняется. Лидеры рынка, такие как Moderna и BioNTech, также активно интегрируют ИИ в свои НИОКР, однако подход Sanofi к сквозному дизайну полноразмерных цепей дает серьезное преимущество в скорости прохождения доклинических этапов. Это позволяет радикально сократить Капитальные затраты на итеративные лабораторные тесты.
Синтез от АПТЕКИУМ: mRNA-GPT — это не просто технологический апгрейд, а рождение «ChatGPT для лекарств». Если раньше создание мРНК-конструкции требовало месяцев эмпирической валидации, то теперь мы вступаем в эпоху программируемой биологии, где цифровая последовательность становится гарантированным рецептом терапевтического успеха. Для Большой фармы это означает обнуление старых методологий и переход к мобилизационному сценарию внедрения генеративного ИИ во все звенья создания лекарств.
Данная публикация предназначена для специалистов здравоохранения и участников фармрынка. Аналитические выводы редакции носят информационный характер и не являются призывом к самолечению или заменой очной консультации врача. При работе с лекарственными препаратами необходимо руководствоваться официальной инструкцией и мнением профильного специалиста. Полный текст дисклеймера.
