Размер шрифта:
+
Цвет сайта:
Изображения:

Учёные ТУСУРа изучают шёпот, чтобы научить компьютер более точно распознавать человеческую речь

07 февраля 2018
Учёные ТУСУРа изучают шёпот, чтобы научить компьютер более точно распознавать человеческую речь

Учёные Томского государственного университета систем управления и радиоэлектроники исследуют малоизученную шёпотную речь человека для создания алгоритмов по распознаванию речи человека с высокой точностью.

На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала. Их результатом может стать создание новых алгоритмов, принципиально отличающихся от существующих, для корректного и более точного распознавания речи человека.

Как пояснил доцент кафедры КИБЭВС Антон Конев, речевые технологии в ближайшем будущем будут активно развиваться – для создания голосовых ассистентов, а также других новых продуктов в сфере искусственного интеллекта. Одна из главных целей разработчиков во всём мире – добиться полностью автоматического перевода устного текста любого объёма в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», – говорит Антон Конев.

Суть этого подхода, по словам доцента ТУСУРа, – что основой распространённых алгоритмов является обучение на большом количестве примеров произнесённых звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесённое. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается, и существующие системы ошибаются очень часто, – подчёркивает исследователь. – Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе».

Поэтому своей задачей учёные кафедры КИБЭВС ТУСУРа называют определение более точных параметров звуков, в том числе с помощью изучения шёпотной речи.

Антон Конев

Есть классический термин – форманта, максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шёпотную речь, которая отделена от голосового источника и лишена этих искажений.

Исследования, проводимые с использованием уникальной разработки учёных кафедры КИБЭВС ТУСУРа – математического аппарата, учитывающего строение слуховой системы человека, показали, что распознавание ударных звуков шёпотной речи на основе общепринятых параметров возможно с надёжностью не менее 70 %.

Такой результат позволяет говорить о перспективности исследований для выявления точных параметров звуков, которыми мало занимаются в России и за рубежом, но которые могут послужить основой для принципиально нового подхода в точном распознавании речи – для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, развитие которых становится всё более актуальным.

Материалы по теме

17 августа 2018

На волне интереса к «умным» аудиоустройствам студенты ТУСУРа спроектировали, разработали и собрали в лаборатории «из подручных средств» ламповый MP3-проигрыватель с выходом в Интернет.

10 августа 2018

Созданная учёными ТУСУРа активно-импульсная телевизионная измерительная система способна во многих случаях заменить камеру, лидарную систему и радар для ориентации беспилотных автономных аппаратов в пространстве, обнаружения и распознавания объектов, в том числе в сложных метеоусловиях.

14 августа 2018

14 – 16 сентября в Томске состоится МедХакатон для всех, кто заинтересован в развитии IT для медицины.

08 августа 2018

Учёные Центра космического мониторинга Земли (ЦКМЗ) ТУСУРа создают интеллектуальную систему, способную самостоятельно проводить анализ долговременных изменений, происходящих на больших территориях, выявляя из них природные и антропогенные.