В научных статьях нашли тысячи ссылок на исследования, которых не существует

Аудит 2,5 млн биомедицинских публикаций показал: проблема фальшивых ссылок быстро растет

Исследователи проверили почти 2,5 млн биомедицинских статей из открытого сегмента PubMed Central и нашли 4046 сфабрикованных ссылок в 2810 публикациях. Это не просто ошибки оформления: часть ссылок вела на работы, которых, по данным проверки, не существует. Главный вывод — научным журналам придется проверять списки литературы автоматически до публикации, иначе фиктивные источники будут попадать в доказательную базу медицины.

Рецензент медицинского журнала проверяет ссылки в биомедицинских статьях на фоне роста числа сфабрикованных научных цитирований

Аудит 2,5 млн биомедицинских статей показал резкий рост ссылок на исследования, которых не существует

Наука держится не только на выводах, но и на ссылках

Когда мы читаем научную статью, мы редко проверяем каждую ссылку в списке литературы. Но именно ссылки показывают, на чем стоит утверждение автора.

Если ссылка ведет на реальное исследование, читатель может открыть источник, проверить методику, данные и выводы. Если ссылка ведет в пустоту, научная цепочка обрывается.

В медицине это особенно опасно. Здесь статьи могут попадать в обзоры, обзоры — в клинические рекомендации, а рекомендации — влиять на решения врачей и лечение пациентов.

Что именно проверяли исследователи

Команда Maxim Topaz и коллег провела аудит ссылок в 2 471 758 биомедицинских статьях, опубликованных в открытом сегменте PubMed Central с 1 января 2023 года по 18 февраля 2026 года.

Всего система извлекла 125 615 773 структурированные ссылки. Из них 97,1 млн имели PMID — идентификатор PubMed — и могли быть проверены автоматически. Остальные 23% ссылок, в основном сайты, книги, серая литература и неопубликованные материалы, в анализ не вошли.

Это важное ограничение. Исследование не говорит, что проверило вообще всю биомедицинскую литературу. Оно говорит: в большом открывом массиве PubMed Central среди проверяемых ссылок проблема уже видна на масштабе миллионов статей.

Как отличали ошибку от выдумки

Не каждая неправильная ссылка — фальсификация. Иногда автор сокращает название статьи, ошибается в пунктуации, переносит не тот номер или оформляет источник не по правилам.

Поэтому исследователи построили многоступенчатую систему. Сначала они сравнивали заявленные данные ссылки с реальными записями PubMed и Crossref. Затем отсеивали технические ошибки парсинга и случаи, похожие на обычные расхождения в оформлении.

После этого подозрительные ссылки дополнительно проверяли по PubMed, Crossref, OpenAlex и Google Scholar. Если работа не находилась ни в одной из этих баз, ссылку классифицировали как сфабрикованную. Если работа существовала, но была привязана к неправильному идентификатору, это считали ошибкой ссылки, а не выдумкой.

Точность автоматической системы оценили на выборке из 500 записей с участием трех независимых рецензентов. По данным авторов, precision составила 91%. Но они отдельно подчеркивают: такая проверка оценивает точность найденных случаев, а не полноту. То есть часть сфабрикованных ссылок могла остаться незамеченной.

Цифры небольшие — пока не посмотреть на рост

На первый взгляд 4046 сфабрикованных ссылок среди 97,1 млн проверенных может показаться малой долей. Но здесь важен не только абсолютный масштаб, а скорость роста.

В 2023 году примерно одна статья из 2828 содержала хотя бы одну сфабрикованную ссылку. В 2025 году — уже одна из 458. В первые семь недель 2026 года — одна из 277.

В 2023 году примерно одна статья из 2828 содержала хотя бы одну сфабрикованную ссылку. В 2025 году — уже одна из 458. В первые семь недель 2026 года — одна из 277.

Иначе говоря, проблема за короткое время стала заметно чаще встречаться в опубликованной биомедицинской литературе.

Авторы подсчитали, что уровень фальсификации вырос более чем в 12 раз: примерно с 4 случаев на 10 000 статей в 2023 году до 51,3 на 10 000 в четвертом квартале 2025 года и 56,9 на 10 000 в начале 2026 года.

Почему это связывают с ИИ, но не сводят только к нему

Исследование осторожно обсуждает возможную роль больших языковых моделей. Такие системы умеют генерировать убедительно выглядящие ссылки: с реальными фамилиями авторов, правдоподобными названиями журналов и похожими датами публикации.

Проблема в том, что убедительный вид не означает существование источника.

Авторы отмечают: резкий перелом в динамике начался примерно в середине 2024 года. Это совпадает с ожидаемым лагом после массового распространения LLM-инструментов в 2022–2023 годах. Если учесть, что путь от подачи статьи до публикации может занимать месяцы, LLM-сгенерированные тексты могли начать массово появляться в базах именно с таким запозданием.

Но исследователи не утверждают, что виноват только ИИ. Возможны и другие причины: активность paper mills — фабрик фальшивых статей, изменения в индексировании журналов, давление на авторов и слабая проверка ссылок при рецензировании.

Ключевой момент не в том, «ИИ испортил науку». Ключевой момент в другом: научная публикационная система оказалась плохо подготовлена к эпохе, когда правдоподобный текст и правдоподобная ссылка могут создаваться автоматически.

Самый тревожный факт: фальшивые ссылки выглядят настоящими

Вот главный момент осознания: найденные ссылки не выглядели как очевидный мусор.

Они были тематически точными, оформленными как нормальные научные источники, приписанными реальным исследователям и снабженными правдоподобными годами публикации.

Именно поэтому обычный рецензент может их пропустить. Рецензент оценивает дизайн исследования, статистику, логику выводов, новизну и соответствие теме. Но ручная проверка десятков или сотен ссылок в каждой статье практически не является стандартной частью peer review.

В результате фиктивная ссылка может пройти весь путь публикации просто потому, что она выглядит достаточно убедительно.

Почему обзоры оказались особенно уязвимы

Авторы обнаружили, что обзорные статьи имели более высокий уровень сфабрикованных ссылок, чем другие типы публикаций: 16,7 на 10 000 против 10,6 на 10 000.

Это важно, потому что обзоры часто воспринимаются как более удобный вход в тему. Их читают врачи, студенты, журналисты, авторы клинических рекомендаций и другие исследователи.

Если в обзор попадает фиктивная ссылка, она может начать жить дальше: ее могут процитировать другие авторы, она может попасть в систематический обзор, а затем — в документ, который влияет на практику.

Так возникает не просто ошибка в одной статье, а загрязнение доказательной цепочки.

Paper mills: когда фальшивые ссылки становятся частью производства

В исследовании описаны паттерны, похожие на активность фабрик научных статей. Например, одни и те же авторы появлялись в серии публикаций в одном хирургическом журнале, а внутри этих работ встречались сфабрикованные ссылки на темы вроде CRISPR-диагностики, AI-направляемых нановакцин и биомаркеров микробиома.

Это не доказывает автоматически вину конкретных людей. Но такие совпадения показывают, что проблема может быть не только индивидуальной небрежностью, а частью системного производства сомнительных публикаций.

Большинство затронутых статей содержали одну или две сфабрикованные ссылки. Но 246 статей имели три и более.

Что это значит для обычного читателя

Для пациента или читателя медицинских новостей это не значит, что «вся наука фальшивая». Такой вывод был бы неправильным и вредным.

Но это значит, что научная статья — не магический знак качества сама по себе. Важны журнал, методология, прозрачность данных, проверяемость источников и реакция издателя на ошибки.

Если медицинское утверждение опирается на ссылку, которой не существует, это утверждение невозможно нормально проверить. А если таких ссылок много, доверие к статье должно снижаться.

Особенно осторожно стоит относиться к публикациям, которые обещают слишком гладкую картину: много современных терминов, идеальные формулировки, очень узкие и «модные» темы, но слабая проверяемость источников.

Инфографика о росте числа сфабрикованных ссылок в биомедицинских статьях и рисках для научной литературы

Аудит 2,5 млн биомедицинских публикаций выявил резкий рост ссылок на несуществующие исследования. Проблема уже затрагивает систему научной проверки и доказательной медицины.

Что предлагают авторы исследования

Исследователи предлагают четыре практических шага.

Первый — встроить автоматическую проверку ссылок в процесс подачи статьи до начала рецензирования. Технически это уже возможно; барьер скорее организационный.

Второй — добавить метаданные о целостности ссылок в базы индексирования, чтобы читатели и системы могли видеть, проходила ли статья проверку.

Третий — ретроспективно проверять уже опубликованные работы и выпускать исправления или ретракции, если фиктивные ссылки подрывают выводы статьи.

Четвертый — выделить сфабрикованные ссылки как отдельную категорию нарушений научной добросовестности. Сейчас такие случаи не всегда удобно отслеживать системно.

Почему автоматическая проверка не отменяет ответственность человека

Интересная деталь: сами авторы использовали Claude для помощи с кодом, грамматикой и пунктуацией, а затем проверяли и редактировали результат. Это важное различие.

ИИ-инструмент не обязательно проблема. Проблема начинается там, где человек перестает проверять результат и переносит в научный текст то, что выглядит убедительно, но не существует.

В будущем нормой, вероятно, станет не запрет ИИ, а обязательная верификация: ссылок, данных, цитат, изображений, статистики и заявления о методах.

Наука всегда строилась на проверяемости. Новая эпоха просто делает эту проверяемость технически необходимой на каждом этапе.

Читайте также на АПТЕКИУМ:

Контекст рынка и отрасли:

Где границы этого исследования

Авторы честно указывают ограничения.

Анализ охватывал только открытый сегмент PubMed Central, а не всю биомедицинскую литературу. Ссылки без PMID не проверялись. Данные за 2026 год включали только первые семь недель. Система оценивала найденные случаи с высокой точностью, но не могла гарантировать, что нашла все сфабрикованные ссылки.

Кроме того, исследование выявляет проблему, но не устанавливает причину каждого конкретного случая. Фальшивая ссылка могла появиться из-за paper mill, намеренного нарушения, ошибки при использовании ИИ или других факторов.

Именно поэтому правильный вывод — не паника, а усиление инфраструктуры проверки.

Синтез от АПТЕКИУМ: Главный риск не в том, что в науке появились ошибки. Ошибки были всегда. Новый риск в том, что фальшивые ссылки стали выглядеть достаточно правдоподобно, чтобы проходить через систему — и теперь сама система должна научиться проверять их автоматически.

Стандарты издания
Материал подготовлен в соответствии с Редакционной политикой АПТЕКИУМ

18+ Для профессионального сообщества:

Данная публикация предназначена для специалистов здравоохранения и участников фармрынка. Аналитические выводы редакции носят информационный характер и не являются призывом к самолечению или заменой очной консультации врача. При работе с лекарственными препаратами необходимо руководствоваться официальной инструкцией и мнением профильного специалиста. Полный текст дисклеймера.

В научных статьях нашли тысячи ссылок на исследования, которых не существует

Аудит 2,5 млн биомедицинских публикаций показал: проблема фальшивых ссылок быстро растет

Наука держится не только на выводах, но и на ссылках

Что именно проверяли исследователи

Как отличали ошибку от выдумки

Цифры небольшие — пока не посмотреть на рост

Почему это связывают с ИИ, но не сводят только к нему

Самый тревожный факт: фальшивые ссылки выглядят настоящими

Почему обзоры оказались особенно уязвимы

Paper mills: когда фальшивые ссылки становятся частью производства

Что это значит для обычного читателя

Что предлагают авторы исследования

Почему автоматическая проверка не отменяет ответственность человека

Где границы этого исследования

Источники и материалы

НОВОСТИ на почту:

ЛУЧШЕЕ:

Новартис пересматривает производственные связи после конфликта с Porton

Bayer закрывает один из крупнейших экологических споров Monsanto

Sanofi усиливает позиции в ХОБЛ после успеха итеpeкимаба

Написать нам:

Категории

نموذج الاتصال