Потерянные миллионы графоклеток

Аналитика Экспертное мнение BI-платформа
В статистических и оперативных отчетах региональных медицинских информационно-аналитических центров, отвечающих за сбор и обработку данных об оказании медпомощи, – миллионы графоклеток с различными показателями. Тем не менее извлечь нужную информацию можно не всегда.

 Yana_Zvereva.jpg Необходимы специальные инструменты, которые позволят эффективно работать с данными, чтобы руководитель мог не только выявить проблему, но и разобраться в ее причинах. Разбирается эксперт Яна Зверева, руководитель направления аналитики, «Нетрика Медицина»

Всё было бы просто, если бы не было так сложно

Аналитические BI-системы давно и успешно применяются во многих отраслях, но их внедрение в здравоохранении имеет свою специфику:
   
  • Невозможно сопоставить данные отчетов

В здравоохранении на уровне региона и тем более страны задействовано множество информационных систем: бухгалтерские, кадровые, медицинские, лабораторные и др. В большинстве этих систем предусмотрена возможность формирования отчетов, но поскольку системы между собой не связаны, сопоставить данные из таких отчетов и получить более подробную картину невозможно.

Например, отчетность о причинах смертности и о лабораторных исследованиях формируется в двух разных типах систем. Отчеты содержат агрегированные данные, из которых невозможно установить принадлежность к пациенту. Выявить связь между определенным лабораторным показателем и летальным исходом на основе таких отчетов невозможно.
  • Низкое качество данных
Ошибки ручного ввода, опечатки и просто халатное отношение к заполнению электронных форм в масштабах региона может приводить к большой погрешности в отчетах. Из усредненных данных в отчете не ясно, как именно было получено то или иное значение, не является ли отклонение от нормы следствием неверно внесенного параметра или отсутствующих данных пациента.
  • Негибкая система формирования отчетов
Традиционная система сбора статистики в здравоохранении основана на фиксированных формах отчетности. На подготовку срочного или нестандартного отчета тратится огромное количество человеко-часов. За разработку каждого нового отчета приходится платить разработчику, а если нужно посмотреть на те же данные под другим углом, все приходится делать заново.
  • Ограниченные возможности детализации данных
Аналитические инструменты, которые сейчас используются в здравоохранении, как правило, не позволяют «спуститься» от укрупненного показателя до врача, пациента или случая обслуживания. Такие отчеты дают возможность увидеть проблему, но не помогают выявить причину.

Простой пример: если в регионе выявлены случаи оспы, то в отчете для главного эпидемиолога должно быть указано, в каких учреждениях зафиксированы эти случаи и, главное, по какому адресу живут пациенты. Для этого система должна не только формировать отчет, но и детализировать его до необходимого уровня.

Данные — информация — знания

Что же нужно сделать для того, чтобы превратить нарастающий поток информации в реальный ресурс для повышения доступности и качества здравоохранения?

  • Данных собираем много, а на запрос Минздрава быстро не ответить.
  • Разработчик формирует новые отчеты долго, а конструктора для самостоятельного анализа нет.
  • Данные вызывают сомнения, но как рассчитана та или иная цифра, неясно.
  • Отчет формируется несколько дней, а данные нужны сегодня.
Во-первых, чтобы анализировать данные на уровне региона, нужно научиться собирать и хранить данные на региональном уровне. Это сложнее, чем может показаться на первый взгляд: необходимо обеспечить обмен данными между информационными системами, уметь поддерживать актуальное состояние и версионность региональных справочников, а также решить задачу идентификации пациента.

В здравоохранении, в отличие, скажем, от банковской сферы, пациент не всегда может быть идентифицирован по одному документу, например паспорту или полису ОМС. В ряде случаев медицинская помощь может быть оказана без предъявления документов. Определить, какие медицинские записи относятся к одному и тому же человеку, важно, так как в противном случае невозможно обеспечить достоверность статистических данных.

Во-вторых, данные должны быть измеримы, прозрачны и достоверны. Система должна уметь проверять, очищать и обогащать данные: находить пустые поля, удалять лишние пробелы, определять и устранять ошибки кодировки строковых параметров, рассчитывать возраст пациента и отклонение результатов анализов от нормы.


01-_.pngДанных, доступных для анализа и обработки, становится намного больше, чем содержится в статистических формах. Архитектура аналитической системы для здравоохранения должна позволять подключать новые источники данных, не внося изменений в ранее сформированное хранилище.

Сегодня объем медицинских данных измеряется терабайтами, в ближайшем будущем этот показатель вырастет на порядок. Аналитическая система должна быть спроектирована специально для быстрой обработки больших массивов.

Еще одно важное свойство аналитической системы – возможность для пользователя самостоятельно формировать отчеты с помощью конструктора. Это снижает трудозатраты при построении новых отчетов в десятки раз.


Пример того, как аналитическая система может помочь в решении задач здравоохранения, – проект создания BI-системы в Санкт-Петербурге. В городе с 2011 года обмен данными ведется через интеграционную шину, поэтому на региональном уровне накоплен большой массив информации. Задача в том, чтобы корректно совместить данные из различных региональных сервисов – интегрированной электронной медицинской карты (ИЭМК), обмена данными лабораторных исследований, управления очередями на оказание медицинской помощи и других – и сделать их доступными для анализа. Одна из поставленных перед системой задач – предоставить данные пациентов, у которых в течение года были выявлены превышающие норму значения определенных онкомаркеров.

Аналитика — будущее здравоохранения

Сегодня перед нами стоит задача собрать и объединить данные из региональных сервисов для того, чтобы предоставить пользователю средства для самостоятельного и эффективного анализа данных.

Речь идет не только об автоматизации отчетности – возможности аналитических инструментов намного шире. Одна из наиболее перспективных областей применения аналитических систем – выявление неэффективных процессов. Например, с помощью анализа данных лабораторных исследований можно изучать маршрутизацию лабораторных исследований – это ценная информация для управления процессом централизации лабораторий. Совместив данные о лабораторных исследованиях с информацией ИЭМК, можно уменьшить количество повторно назначаемых и необоснованных исследований, контролировать соблюдение сроков лабораторной диагностики, исследовать частоту выявления патологии у разных групп пациентов.

Долгосрочная, но важная цель – глубокий анализ данных, поиск причин и взаимосвязей, который будет служить основой для одного из самых перспективных направлений научных исследований – персонифицированной медицины.