• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site
  • HSE University
  • IQ media
  • News
  • Машинное обучение помогло предсказать очаги нестабильности и революций в мире

Машинное обучение помогло предсказать очаги нестабильности и революций в мире

От Ливана до Грузии — клиометристы из НИУ ВШЭ назвали страны с самым высоким риском народных волнений в ближайшие пять лет

Сначала коротко

Проблема: Вооруженные и мирные протесты в истории — явление нередкое. Начиная с середины прошлого века наука активно изучает и пытается прогнозировать эти феномены социальной нестабильности.

Решение: Предсказать революционные события сложно из-за необходимости учитывать огромное количество показателей, особенно когда речь не об обращении к прошлому, то есть составлению индексов революций постфактум, а о стремлении разглядеть угрозы в будущем. На помощь приходят новые методы анализа больших массивов статистической информации на основе искусственного интеллекта. Например, машинное обучение.

Теперь подробнее

Учёные НИУ ВШЭ Андрей Коротаев и Илья Медведев применили машинное обучение (machine learning, ML) для построения индекса нестабильности в мире. Новый метод позволил использовать и нестандартно распределить большое количество переменных. Благодаря этому исследователям удалось предложить и успешно протестировать собственный способ построения индекса на период в пять лет, а также составить списки стран, где протесты наиболее ожидаемы. Результаты работы, выполненной при поддержке Российского научного фонда, представлены в ежегоднике «Системный мониторинг глобальных и региональных рисков» (том 12, 2021).

О чём речь?

Традиционных подходов к построению индекса нестабильности три. Первый (он практикуется чаще всего) — чисто математический, когда события предсказывают на небольшом количестве емких переменных, характеризующих развитие страны. Второй — метод «группировок и оценок» — индекс составляется на базе нескольких субиндексов (субиндекс безопасности, политический, экономический, социальный) плюс результаты корректируются экспертами. Третий — комбинированный — в финальную модель включают итоги математического моделирования и блок от экспертов.

 

Ни один из них, считают Илья Медведев и Андрей Коротаев, не даёт возможности отразить взаимодействие показателей разных категорий, учесть все страновые факторы и не потерять часть информации при объединении данных.

Чтобы это исправить, авторы исследования пошли своим путём. Алгоритмы искусственного интеллекта позволили взять в расчёт большое количество переменных и задействовать их в математической модели одновременно, то есть без разделения на субиндексы. От экспертных оценок отказались из-за их нестабильности и неуниверсальности для разных стран.

Как изучали?

Индексы строились с помощью моделей машинного обучения с учителем (supervised learning methods), то есть алгоритм обучался и делал прогноз исходя из загруженных данных и уже готового ответа (наличие революционных событий).

Для расчетов применили библиотеку Яндекса Catboost — модель машинного обучения с алгоритмом градиентного бустинга (gradient boosting). Под градиентом понимается вектор, задающий направление наиболее быстрого изменения величины, бустинг в переводе с английского — «усиление», а всё вместе — технология создания прогнозной модели в форме набора логических схем (деревьев решений), позволяющих получать ответ. «Усиление» означает, что несколько слабо обученных алгоритмов преобразуются в один сильный: каждый последующий учитывает ошибки предыдущего и улучшает предсказание.

Невооруженные и вооруженные протесты рассматривались порознь. Соответственно, предсказательных моделей получилось две, а на выходе — два индекса революционных событий. Первый — для мира в целом, и отдельно — для афразийской макрозоны, одного из самых взрывоопасных регионов. Прогнозировался не конкретный год революций, а вероятность их возникновения в течение пяти лет.

 

Для расчётов применили свыше 240 показателей (экономических, политических, демографических, социальных), взятых из нескольких баз: межнационального архива CNTS (Cross National Time Series Database, 200 стран с 1815 по 2020 год), отчёта МВФ Global Manufacturing Downturn, Rising Trade Barriers–2019, подборки статистики Всемирного банка World Development Indicators (2020) и др.

Что получили?

В перечень стран с наибольшим риском невооруженных выступлений вошли 25 государств. На вершине списка — Ливан, Гондурас, Алжир, Боливия, Черногория. А замыкают его — Колумбия, Афганистан, Доминиканская Республика, Индонезия, Узбекистан. 

Предсказанный индекс риска начала невооруженных революционных выступлений

(топ стран мира с наибольшим риском в ближайшие пять лет — от наибольшей прогнозной нестабильности к меньшей)

 

Ливан

24,36

Гондурас

18,64

Алжир

9,55

Боливия

5,35

Черногория

3,64

Албания

2,09

Ирак

1,9

Чили

1,34

Израиль

1,31

Гаити

1,22

Непал

0,78

Египет

0,61

Судан

0,6

Франция

0,56

Мали

0,52

Гватемала

0,5

Марокко

0,5

Иран

0,46

Индия

0,46

Мьянма

0,43

Колумбия

0,43

Афганистан

0,43

Доминиканская Республика

0,35

Индонезия

0,35

Узбекистан

0,34

Источник: И. Медведев, А. Коротаев, «Построение предсказательного индекса революций: опыт использования методов машинного обучения»

В Ливане, комментируют исследователи, нестабильность действительно наблюдается уже много лет. В Афганистане вслед за завершившейся (вооруженной) революцией может последовать ещё одна — невооруженная.

На 14-й позиции расположилась Франция — страна из так называемого мир-системного центра, то есть государств с высокоразвитыми экономиками и политическим весом. В их случаях речь может идти о мирных манифестациях по типу движения «Жёлтые жилеты».

В целом в топе болевых точек преобладают страны со средним подушевым доходом из списка мир-системной полупериферии, то есть тех, кто занимает промежуточное положение между упомянутым центром и периферией, поставляющей государствам-лидерам сырьё и зависимой от них.

 

На результат в первую очередь повлияли социальные показатели (уровень угнетения отдельных слоёв населения, индекс свободы вероисповедания и проч.). Экономические и политические (подушевой ВВП, долговечность политического режима и др.) менее значимы и на последнем месте — демографические (например, плотность и численность населения).

Обратная ситуация — с предсказаниями вооруженных революций. Социальные факторы в этом случае отступают, а наибольший вклад вносят политические, отражающие характер режима в стране.

Первые места в списке 19 государств с вероятностью вооруженных конфликтов достались Индии, Анголе, Чаду, Нигеру, Бурунди. На другом полюсе — Ливия, Бангладеш, Мали, Мьянма, Египет.

Предсказанный индекс риска начала вооруженных революционных выступлений

(топ стран мира с наибольшим риском в ближайшие пять лет — от наибольшей прогнозной нестабильности к меньшей)

 

Индия

3,22

Ангола

2,31

Чад

2,31

Нигер

2,15

Бурунди

2,07

Южный Судан

1,96

Мозамбик

1,95

Афганистан

1,92

Сирия

1,89

Пакистан

1,83

Йемен

1,82

Центральноафриканская Республика

1,79

Сомали

1,78

Ирак

1,73

Египет

1,68

Мьянма

1,64

Мали

1,58

Бангладеш

1,56

Ливия

1,50

Источник: И. Медведев, А. Коротаев, «Построение предсказательного индекса революций: опыт использования методов машинного обучения»

«Индия давно демонстрирует заметные проявления нестабильности; Нигер, Чад и Мали также не удивляют, в этих регионах уже длительное время состояние стран можно охарактеризовать как failed state — недееспособное государство», — поясняют Андрей Коротаев и Илья Медведев.

В отличие от прогноза по невооруженным выступлениям, рискам насильственных революций главным образом подвержена не полупериферия, а периферия — государства с «низкими подушевыми доходами, высокой рождаемостью, очень молодым, малообразованным и слабо урбанизированным населением».

Такой же результат, то есть готовность бунтовать с оружием прежде всего «периферийных» стран, продемонстрировала и афразийская макрозона — Ближний Восток (в том числе Северная Африка), Большой Средний Восток (включая Среднюю Азию и Пакистан) и Сахель. Прогноз для региона учёные, напомним, рассчитали отдельно.

Главные потенциальные угрозы в нём — территории с очень нестабильной экономической и политической обстановкой (Чад, Нигер, Южный Судан, Афганистан, Сирия, Пакистан, Йемен, Центральноафриканская Республика, Сомали, Ирак). На нижних позициях — те, чьи проблемы скорее социального плана: Грузия, Объединенные Арабские Эмираты (ОАЭ), Армения, Израиль, Оман.

«Для очень богатых стран макрозоны с монархическими режимами (таких как Катар или ОАЭ) характерны низкие риски вооруженной революционной дестабилизации», — отмечается в исследовании. Невооруженной, кстати, тоже: угроза «ненасильственных» выступлений наиболее актуальна для государств со средним по региону ВВП на душу населения и частично демократическим правлением (к примеру, Ливан или Ирак).

Для чего это нужно?

Предложенный метод на основе машинного обучения позволил оценить большой массив данных, составить не только актуальный индекс нестабильности, но и предсказать её на ближайшие несколько лет. Новый подход помогает «устранять множество проблем, с которыми сталкивались предыдущие исследователи», и в итоге делает прогнозирование более точным.
IQ
 

Авторы исследования:
Андрей Коротаев, заведующий Научно-учебной лабораторией мониторинга рисков социально-политической дестабилизации факультета социальных наук НИУ ВШЭ
Илья Медведев, стажер-исследователь Научно-учебной лаборатории мониторинга рисков социально-политической дестабилизации факультета социальных наук НИУ ВШЭ
 
Author: Svetlana Saltanova, March 31, 2022