• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
vision

Исследователи ВШЭ научили компьютер распознавать эмоции в речи

8 ноября

Сотрудники факультета информатики, математики и компьютерных наук Нижегородского филиала ВШЭ создали автоматическую систему, способную определять эмоции по голосу. Их доклад был представлен на международной конференции «Neuroinformatics-2017».

 

Компьютер давно и весьма успешно преобразует речь в текст. Однако эмоциональная составляющая, важная для передачи смысла, остаётся упущенной. Например, на один и тот же вопрос «Всё в порядке?», человек может ответить «Конечно!» с разными интонациями: спокойно, с вызовом, жизнерадостно и пр. Это будут совсем разные реакции.

Анастасия Попова, Александр Рассадин и Александр Пономаренко из ВШЭ обучили нейронную сеть распознавать восемь различных эмоций. Она определяет злость, грусть, спокойствие, нейтральность, счастье, испуг, удивление, отвращение. В 70% случаев компьютер правильно распознает эмоцию.

Исследователи преобразовывали звук в изображения – спектрограммы. Это позволило работать со звуком методами, применяемыми для распознавания изображений. В исследовании использовалась свёрточная нейронная сеть глубокого обучения с архитектурой VGG-16.

Наиболее успешно программа различает нейтральные и спокойные интонации. А вот счастье и удивление распознаются не всегда, отмечают ученые. Счастье часто воспринимается как страх и печаль, а удивление – как отвращение.