Клиническая фармакология × искусственный интеллект · КМН

Граф-RAG СППР по лекарственной безопасности на российских регуляторных данных

Отчёт по поисковому исследованию: где научная новизна и незанятая ниша для системы поддержки принятия врачебных решений (СППР), которая проверяет назначения с учётом контекста пациента. Все факты получены веерным поиском по источникам с состязательной проверкой каждого утверждения. Документ открыт к научной критике.

Ключевые выводы → Что можно раскритиковать 📚 Библиотека отчётов

этапов исследования

от мирового поля до формальностей ВАК

~113

источников

PubMed, arXiv, ГОСТ, ВАК, РФ-первоисточники

~106

подтверждённых фактов

из ~472 извлечённых утверждений

~19

отклонено при проверке

не прошли состязательное голосование

🎯 паспорт ВАК 3.3.6 «Фармакология, клиническая фармакология» 🇷🇺 ГРЛС + АИС «Фармаконадзор» 📜 ГОСТ Р 72357-2025 · ПП № 1684 🤖 ядро — LLM (GigaChat) + bge-m3

Вопрос исследования

Где конкретно научная новизна и незанятая ниша в применении больших языковых моделей (LLM) и RAG как СППР по лекарственной/фармакологической безопасности — для кандидатской диссертации на стыке клинической фармакологии и AI, с учётом российского контекста и практической применимости.

🧩

Проблема

Нежелательные реакции и лекарственные взаимодействия при полипрагмазии — врач физически не удерживает весь контекст.

💡

Гипотеза

«Драгчекер с контекстом»: граф-RAG на основе LLM, который учитывает анамнез конкретного пациента, а не пары препаратов в отрыве.

🎓

Команда

IT-исследователь (архитектура, ML) + соавтор — клинический фармаколог (предметная экспертиза, доступ к данным, валидация).

Метод — как получены факты

Каждый этап — веерный поиск по 5–6 независимым углам, извлечение проверяемых утверждений и состязательная верификация: на каждый факт — несколько независимых «скептиков», утверждение «убивается» при большинстве голосов против. В отчётах публикуются и подтверждённые, и отклонённые утверждения — для прозрачности.

Мировое поле

Состояние LLM/RAG в лекарственной безопасности; прототипы, метрики, провалы.

Российская специфика

Базы (ГРЛС, Фармаконадзор), нормативка (ГОСТ, ПП), русские бенчмарки.

Оригинальность и ВАК

Соседи, паспорт специальности, лицензии данных.

Финальная проверка

Дубликаты, юр. статус ГРЛС, дизайн апробации, нормативный каркас валидации.

Закрытие хвостов

Первоисточники по дубликатам, требования ВАК, открытые данные.

Ограничение метода (честно): это автоматизированный поиск с фактчекингом, а не систематический обзор по PRISMA. Поиск дубликатов по диссертационным базам — выборочный, не исчерпывающий. Все спорные места вынесены в раздел «Критика».

Ключевые выводы

Пять выводов, на которых стоит обоснование темы. Каждый подкреплён источниками (см. библиотеку).

Мировое поле

Проблема не решена — и это шанс

Из ~30 мировых исследований — ни одной проспективной клинической валидации.
Главный провал ИИ — контекстное рассуждение, а не знание фактов.
На реальных EHR доля полностью верных разборов ≈ 47%.
Лучший режим — co-pilot (ИИ + врач), не автономия.

Российская рамка

Под тему уже есть нормативная опора

ГОСТ Р 72357-2025 — прямо про ИИ-СППР в лекарственной терапии (датасет + метрики).
ГОСТ Р 71671-2024, серия 59921.x — СППР с ИИ и клиническая оценка.
ПП № 1684 (с 2025): регистрация ИИ-медизделия обязательна.
Диссертация ложится в рамку → сильная актуальность.

Ниша

Тема свободна, прямого дубликата нет

Дубликата по медицинским специальностям не выявлено.
Два «соседа» — с другим методом или источником данных (см. ниже).
Связка граф-RAG/LLM + официальные базы + проспективная валидация — свободна.

Данные

Данные доступны — с нюансами

ГРЛС — открытые данные, разрешение не нужно; клиника — в PDF-инструкциях (нужен NLP).
АИС «Фармаконадзор» — закрытая; доступ через организацию соавтора (есть прецеденты).
Open-data Росздравнадзора нежелательных реакций не содержит.

Эмпирика на русском

Языковой перекос воспроизводится на русских медданных

На бенчмарке RuMedBench отставание лучших моделей от уровня врача на задаче клинического рассуждения превышает 20 п.п. (71,48% против 93,36%). Маппинг русских нежелательных реакций на словарь MedDRA работоспособен (~70,9% F1, эмбеддер класса bge-m3). Но всё это — на BERT-моделях 2022 г. и интернет-отзывах; перенос на современные генеративные LLM и реальную клинику — незакрытая новизна.

Научная новизна

Впервые разработана СППР по лекарственной безопасности на основе графового RAG с применением LLM (в отличие от байесовских систем), опирающаяся на официальные российские регуляторные источники — ГРЛС и АИС «Фармаконадзор» (в отличие от корпусов пользовательских отзывов), с предложенной клинически-ориентированной метрикой контекстной корректности и проспективной клинической валидацией по национальным стандартам.

Метод

граф-RAG/LLM, а не байес и не плоский RAG

Источник

официальные регуляторные базы, а не отзывы

Метрика

контекстная корректность, а не агрегированная точность

Доказательство

проспективная валидация по ГОСТ Р 72357-2025

Конкурентный ландшафт — «соседи»

Честная отстройка от ближайших работ. Прямого дубликата нет, но эти линии надо процитировать и явно отличиться.

Работа	Что делает	Чем мы отличаемся
Группа Тутубалиной (Казань), RuDReC	извлечение нежелательных реакций из интернет-отзывов; докторская — по компьютерным наукам	официальные регуляторные источники + медицинская специальность
Грант РНФ 23-75-30012 (Судаков, РЭУ)	граф знаний из ГРЛС для СППР по полипрагмазии; байесовские сети, без LLM; одна нозология (ХСН)	граф-RAG/LLM + АИС «Фармаконадзор» + проспективная валидация
«Вестник РАМН» 79(3), 2024 (та же группа)	графовая вероятностная модель лекарственных взаимодействий	генеративный LLM-слой + клинико-ориентированная метрика

Что можно (и нужно) раскритиковать

Раздел специально для коллег. Здесь — слабые места, отклонённые при проверке утверждения и открытые вопросы. Мы заинтересованы в том, чтобы их пробили.

⚠️ Ограничения и риски

Поиск дубликатов — не исчерпывающий (диссертационные базы плохо индексируются).
Русская эмпирика (RuMedBench, RuDReC) — на BERT-моделях и отзывах, не на генеративных LLM и не на реальных EHR.
Клиника ГРЛС лежит в PDF → качество NLP-извлечения — критическая точка.
Доступ к АИС «Фармаконадзор» зависит от аффилиации соавтора.
Согласие ИИ с экспертом бывает низким (пример: каппа 0,17/0,16/0,03) — планку завышать нельзя.

✗ Отклонено при проверке

«Co-pilot даёт +32,6%» — конкретная цифра не подтверждена (польза co-pilot — да, цифра — нет).
«Fine-tuned LLM бьёт классический ML на лекарственных взаимодействиях» — отклонено.
«Маленькие 7–8B модели уже надёжны» — отклонено.
«ГРЛС свободен без ограничений» — нюанс: открытые данные, но режим с атрибуцией.
«MedDRA ограничена в РФ с 2023» — не подтверждено.

❓ Открытые вопросы

Обязателен ли этический комитет для паспорта 3.3.6; 2 или 3 статьи ВАК у конкретного диссовета.
Ст. 1334 ГК РФ (право изготовителя базы) при коммерческом продукте.
Воспроизведутся ли провалы контекста на реальных российских EHR.
Целевые значения метрик апробации (с соавтором-клиницистом).

📝 Как дать обратную связь

Мы будем благодарны за критику по любому пункту — особенно по методологии валидации, выбору метрик и отстройке от соседних работ.

Откройте библиотеку отчётов — там каждый факт со ссылкой на источник.
Замечания — по контакту научного руководителя / соавтора проекта.