Пресс-релиз от 24 сентября 2013г Ученые ТУСУР разрабатывают программу распознавания эмоций человека по голосу Программа голосовой идентификации сможет определить эмоциональное состояние человека, его самочувствие.

24 сентября 2013

Разработчики – ученые кафедры комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) ТУСУР – приводят самый простой пример использования такой программы: контроль состояния человека, приступившего к работе. Это особенно важно, когда деятельность требует предельной концентрации внимания или от действий специалиста зависит жизнь людей.

- В таких случаях с помощью программы можно будет определить, способен ли человек приступить к качественному выполнению своих должностных обязанностей, - рассказывает доцент кафедры КИБЭВС ТУСУР Антон Конев. - Для этого нужно просто произнести несколько фраз: если сотрудник болен или перевозбужден, это скажется на голосе, и программа сможет определить, есть ли отклонения от нормального состояния.

Дело в том, поясняют ученые ТУСУР, что произношение звуков и слов человека зависит от его психофизиологического, эмоционального состояния. Когда он сильно напряжен или злится, то произносит звуки быстрее, если же доволен, то, наоборот, начинает тянуть звуки. Помимо длительности произношения звуков, программа показывает и ряд других параметров, например, изменение частоты основного тона, которому соответствуют колебания голосовых складок человека. При нормальном состоянии речь плавная и частота основного тона практически не изменяется, когда же человек сильно взволнован, наблюдается динамика изменений: идут резкие возрастания, падения.

Помимо определения состояния человека, приступающего к работе, наработки ученых кафедры КИБЭВС смогут использоваться и для проведения судебной экспертизы по «идентификации диктора», когда по записи голоса нужно определить, кому этот голос принадлежит, а также при создании более точных систем распознавания речи. Программы идентификации уже существуют, но, по словам профессора кафедры КИБЭВС Романа Мещерякова, к сожалению, не обладают высокой точностью и могут использоваться только опытными экспертами-криминалистами. Не являются точными и популярные в настоящее время системы распознавания речи, которые разрабатываются для смартфонов, телевизоров и т.д. Ошибки этих программ при распознавании обусловлены, в том числе, тем, что в них не учитывается «эмоциональная составляющая»: что голос человека может звучать устало, печально, радостно, возбужденно.

- Все существующие программы распознавания речи базируются, в основном, на статистике, определенном наборе звуков, - поясняют ученые. - Мы пытаемся определить физическую суть сказанного. Алгоритмы наших программ основаны на биологически выявленных зависимостях слуховой системы по восприятию речевого сигнала.

Такой подход позволил ученым кафедры КИБЭВС реализовать ряд программ для использования в медицинской сфере. Так, в течение 10 лет, успешно используется программа для реабилитации пациентов, перенесших операции на органах голосообразования при онкологических заболеваниях. Разработанная совместно с представителями НИИ онкологии РАМН компьютерная программа помогает оценить, верно ли пациент произносит звуки (до этого качество речи оценивали только на слух), а также помочь практически полностью восстановить речь, вернуть больному способность к полноценному общению с окружающими. При этом огромную методическую работу проводят врачи отделения опухолей головы и шеи НИИ онкологии РАМН.