Zhejiang University форсирует создание мульти-таргетных лекарств через LLM

Цифровая полифармакология: LaMGen переписывает правила НИОКР для борьбы с резистентностью через трехмерную генерацию молекул

Научный коллектив под руководством Yu Kang и Tingjun Hou из Zhejiang University представил архитектуру LaMGen — первую в своем роде генеративную модель на базе больших языковых моделей (LLM), способную проектировать малые молекулы с заданным профилем активности сразу против нескольких белковых мишеней. В отличие от традиционных методов, опирающихся на одномерные SMILES-последовательности, LaMGen оперирует трехмерными ротационными токенами, что позволяет напрямую генерировать энергетически выгодные конформации с квантовой точностью. Этот технологический сдвиг символизирует переход от классического поиска «одной мишени» к системному проектированию препаратов для терапии комплексных онкологических и нейродегенеративных заболеваний, где монотерапия ведет к системному кризису эффективности.

Капля полимера на лабораторном чипе с преломлением 3D-решетки, иллюстрирующая 3D генерацию молекул и цифровую полифармакологию
Одна капля — как модель молекулы: современные ИИ-системы уже проектируют такие структуры быстрее, чем проходит лабораторный эксперимент

Преодоление структурного барьера: почему 3D-контекст критичен для НИОКР

Современный фармрынок сталкивается с проблемой быстрой адаптации опухолевых клеток и нейронов к селективным ингибиторам. Как отмечает Qun Su из Zhejiang University, традиционный подход «одна мишень — одно лекарство» зачастую нивелирует долгосрочный терапевтический эффект из-за включения компенсаторных путей выживания клетки. Мульти-таргетный дизайн (MTDD) призван решить эту задачу, однако сложность одновременной подгонки молекулы под разные связывающие карманы ранее ограничивала возможности исследователей.

Разработка LaMGen базируется на интеграции трех ключевых технологических пластов, которые позволяют модели «понимать» физику взаимодействия:

  • ESM-C протеиновые эмбеддинги: Использование продвинутой языковой модели белков для извлечения функциональных и структурных характеристик мишеней без обязательного наличия их рентгеноструктурного анализа.
  • Rotation-aware токенизация: Представление лигандов через углы вращения связей (torsion angles), что обеспечивает ротационную инвариантность и позволяет LaMGen генерировать пространственно реалистичные структуры.
  • Модуль TriCoupleAttention: Специализированный механизм внимания, который одновременно моделирует взаимодействия «белок-белок», «белок-лиганд» и «лиганд-лиганд» для точной настройки аффинности.

«Использование LLM как генеративного декодера над конформационным пространством позволяет нам миновать стадию длительной посткинетической оптимизации, выдавая физически правдоподобные 3D-структуры за доли секунды», — подчеркивает Генеральный директор по исследовательской части проекта Yu Kang.

Эффективность масштаба: датасет MTD2025 и бенчмаркинг

Для обучения модели авторы сконструировали MTD2025 — специализированный Портфель разработок данных, включающий более 600 000 квантово-точных молекулярных конформаций и 700 000 мульти-таргетных ассоциаций. Этот фундамент позволил LaMGen продемонстрировать превосходство над существующими диффузионными моделями, такими как DualDiff.

Анализ производительности платформы выявил следующие операционные показатели:

  • Скорость генерации: Среднее время создания одной молекулы составляет 0.44 секунды, что почти в 30 раз быстрее конкурентных решений (12.3 сек).
  • Геометрическая точность: Более 98% сгенерированных структур имеют отклонение (RMSD) менее 2 Å от эталонных оптимизированных моделей LiTEN-FF.
  • Успешность докинга: В 85% случаев LaMGen превзошел базовые алгоритмы по предсказанной энергии связывания в сложных парах мишеней.

Особое значение имеет способность модели к «zero-shot» генерации — проектированию активных соединений для пар белков, которые отсутствовали в обучающей выборке. Это открывает перед Большой фармой возможности для форсированного освоения орфанных мишеней и быстрого поиска новых терапевтических ниш.

Терапевтические сценарии: от Альцгеймера до онкологии

В ходе ретроспективной валидации LaMGen успешно восстановил структуру известных ингибиторов и предложил новые, более перспективные аналоги. Например, в проекте по одновременному подавлению киназ JNK3 и GSK3B (критические узлы при болезни Альцгеймера), модель сгенерировала кандидаты с аффинностью около -9 ккал/моль для обеих мишеней, не используя при этом данных о ранее известных лигандах этих белков.

В онкологическом блоке платформа решала задачу тройного таргетирования системы EGFR/HER2/VEGFR. Результаты показали, что LaMGen адаптивно увеличивает молекулярную гибкость и количество полярных центров взаимодействия, чтобы удовлетворить специфическим требованиям кармана VEGFR, сохраняя при этом базовую фармакофорную основу для EGFR и HER2. Этот стратегический маневр позволяет создавать препараты, одновременно блокирующие пролиферацию опухоли и ангиогенез.

Синтез от АПТЕКИУМ: Успех LaMGen знаменует собой окончательную легитимизацию LLM в глубокой химии. Возможность моделировать «системный ответ» через одну молекулу позволит радикально снизить Капитальные затраты на этапе раннего поиска (Early Discovery) и повысить выживаемость проектов в клинических фазах за счет более точного попадания в биологический контекст заболевания.

18+Для профессионального сообщества:

Данная публикация предназначена для специалистов здравоохранения и участников фармрынка. Аналитические выводы редакции носят информационный характер и не являются призывом к самолечению или заменой очной консультации врача. При работе с лекарственными препаратами необходимо руководствоваться официальной инструкцией и мнением профильного специалиста. Полный текст дисклеймера.

Новые Старые

نموذج الاتصال