• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Решетки понятий помогут в борьбе с раком

Алгебра против рака. Математики НИУ ВШЭ разработали модель, которая позволит повысить эффективность лечения при остром лимфобластном лейкозе у детей. Анализируя персональные данные больных с этим диагнозом, ученые смогли рассчитать, какой из методов терапии предпочтительнее для той или иной группы пациентов. Теперь слово за медиками, им предстоит интерпретировать полученный результат и дать по нему клиническое заключение. Положительный результат будет означать еще один шаг в развитии персонализированной медицины в России.

Персонализированная медицина стала главным трендом в здравоохранении, и, прежде всего, в фармакологии XXI века. Она предполагает, что выбор лекарства и схемы его применения делаются на основе индивидуальных параметров пациента – с учетом его физиологических, биохимических, генетических и других особенностей. То есть от лечения болезни «вообще» медики стали переходить к лечению конкретного человека.

Дело в том, что традиционная лекарственная терапия, когда препараты разрабатываются и назначаются «под болезнь» очень часто оказывается неэффективной. В российских СМИ не раз приводилась статистика Всемирной организации здравоохранения (ВОЗ), согласно которой в XXI веке стандартная фармакология не давала нужного результата при лечении язвы у 20-70% пациентов, при лечении сахарного диабета – у 5-57%, артериальной гипертензии – у 10-75%, онкологии – у 70-100%. Учет индивидуальных характеристик (в том числе генетических) особенно важен именно при лечении онкологических заболеваний.

Стимулом к развитию персонализированной медицины стала расшифровка генома человека и использование математических методов обработки клинических данных. Именно такая задача – систематизация и анализ персональных данных больных для выбора оптимальных методик лечения – встала перед группой ученых-математиков Высшей школы экономики.

Почему лекарства не действуют

Как рассказал директор департамента анализа данных и искусственного интеллекта НИУ ВШЭ Сергей Кузнецов, в 2011 году к ним обратился за помощью замдиректора по научной работе Федерального научно-клинического центра детской гематологии, онкологии и иммунологии (ФНКЦ) им. Дмитрия Рогачева Александр Карачунский. «Онрассчитывал, что в «Вышке» может собраться группа математиков и программистов, которые могли бы помочь в анализе данных и построении моделей о заболевании, которое они исследуют» – пояснил ученый. Речь шла об остромлимфобластном лейкозе у детей.

Еще в начале 1990-х годов десятилетняя выживаемость при этом диагнозе в России не превышала 5-10%. Сегодня выживаемость достигает 80-85%, но вот продвинуться дальше в борьбе с недугом врачам не удается. Возможное решение этой проблемы медики видят в персонализированном подходе к лечению, а именно в выделении подгрупп пациентов, для которых применение конкретного препарата или вида терапии будет статистически обосновано.

«Они ждали от нас ответа на вопрос, почему отдельные препараты или отдельные типы терапий действуют лучше, чем другие, – рассказал Сергей Кузнецов. – Возник вопрос, как результат терапии зависит от физиологических свойств пациента – состояния его органов, крови, некоторой генетической информации».

Ученым НИУ ВШЭ предстояло разработать методику поиска пациентов (вернее их подгрупп), для которых есть значимые различия в эффективности стратегий лечения. Выбор делался между двумя видами химиотерапии – DEXA и MEDROL. Сравнивались схожие пациенты (их физиологические параметры совпадали), получающие разные типы лечения.

В качестве базы использовались данные 1773 пациентов в возрасте до 18 лет, больных острым лимфобластным лейкозом. В расчетах учитывался пол, возраст на момент постановки диагноза, состояние органов (печень, селезенка, центральная нервная система), иммунофенотип – характеристика клеток при помощи моноканальных антител, и т.д.

«Взаимодействие некоторых факторов может быть гораздо сложнее, чем мы можем себе представить, это тысячи и даже миллионы комбинаций», – комментирует поставленную задачу участник проекта, научный сотрудник департамента анализа данных и искусственного интеллекта НИУ ВШЭ Наталья Корепанова. Математическое моделирование, по ее словам, позволяет найти связь между комбинациями этих признаков, и установить связь между ними и эффективностью предложенного лечения.

Деревья и решетки

Сначала для анализа данных использовались методы машинного обучения, а именно метод индуктивных порождений деревьев решений. Он позволяет создать визуальную модель, которая подсказывает значение искомой переменной (лист дерева), на основе нескольких переменных на входе (корни дерева). С помощью деревьев решений можно сравнительно быстро обрабатывать очень большие массивы данных.

Однако у этого метода, по словам Кузнецова, есть недостаток – момент случайности в выборе разделяющихся направлений (ветвей). «Если вначале мы выбрали неправильную ветвь, то уже не можем вернуться на другую, которая правильна, – пояснил эксперт. – Но когда цена решения высока, и у нас есть возможность подождать, чтобы обработать наши данные, то мы прибегаем к глобальной оптимизации, которая может занимать время, но зато даст исчерпывающую картину». Поэтому на следующем этапе использовался метод анализа формальных понятий, «который позволяет эффективно перебрать все возможные варианты», объяснил ученый.

Анализ формальных понятий позволяет визуализировать объектно-признаковые зависимости с помощью решеток формальных понятий – их еще называют решетками Галуа. Построить решетку можно по любому бинарному отношению или математическому описанию понятия в виде пары «объект-признак».

В результате анализа ученым действительно удалось выявить группы пациентов, на которых лечение оказывает разный результат. Пример подтвержденной гипотезы выглядит так: MEDROL эффективнее DEXA для пациентов 6,6 лет с размером селезенки не меньше 3,5 и pre-pre или pre-B иммуно-фенотипом. Всего таких пациентов 47. Достоверность – 95%, чувствительность – 84%. При лечении всех пациентов MEDROL удалось бы спасти восемь человек.

Таким образом, была разработана процедура поиска подгрупп, в которых два вида лечения дают разный эффект. «Лучше всего удается выделять небольшие группы с большими различиями, – комментирует результат Кузнецов. – Однако в полной мере оценить качество гипотез можно будет только после проведения клинических исследований». Этим сейчас и занимаются медики Центра. Кроме того, перед учеными остается ряд открытых вопросов, например, как модифицировать процедуру для сравнения трех и более разных стратегий лечения, как учитывать отрицательные события (рецидив, метастазы), и т.д. 

Что касается уже разработанной процедуры, то, как заметил Сергей Кузнецов, она применима не только в гематологии и медицине, но может быть легко адаптирована для любого анализа в подгруппах.

См.также:

«Большие данные» помогут врачам выбрать способ лечения
Искусственный интеллект помогает бороться с работорговлей

 

Автор текста: Гринкевич Владислав Владимирович, 22 декабря, 2015 г.