Размер шрифта:
+
Цвет сайта:
Изображения:

Учёные ТУСУРа изучают шёпот, чтобы научить компьютер более точно распознавать человеческую речь

07 февраля 2018
Учёные ТУСУРа изучают шёпот, чтобы научить компьютер более точно распознавать человеческую речь

Учёные Томского государственного университета систем управления и радиоэлектроники исследуют малоизученную шёпотную речь человека для создания алгоритмов по распознаванию речи человека с высокой точностью.

На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала. Их результатом может стать создание новых алгоритмов, принципиально отличающихся от существующих, для корректного и более точного распознавания речи человека.

Как пояснил доцент кафедры КИБЭВС Антон Конев, речевые технологии в ближайшем будущем будут активно развиваться – для создания голосовых ассистентов, а также других новых продуктов в сфере искусственного интеллекта. Одна из главных целей разработчиков во всём мире – добиться полностью автоматического перевода устного текста любого объёма в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», – говорит Антон Конев.

Суть этого подхода, по словам доцента ТУСУРа, – что основой распространённых алгоритмов является обучение на большом количестве примеров произнесённых звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесённое. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается, и существующие системы ошибаются очень часто, – подчёркивает исследователь. – Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе».

Поэтому своей задачей учёные кафедры КИБЭВС ТУСУРа называют определение более точных параметров звуков, в том числе с помощью изучения шёпотной речи.

Антон Конев

Есть классический термин – форманта, максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шёпотную речь, которая отделена от голосового источника и лишена этих искажений.

Исследования, проводимые с использованием уникальной разработки учёных кафедры КИБЭВС ТУСУРа – математического аппарата, учитывающего строение слуховой системы человека, показали, что распознавание ударных звуков шёпотной речи на основе общепринятых параметров возможно с надёжностью не менее 70 %.

Такой результат позволяет говорить о перспективности исследований для выявления точных параметров звуков, которыми мало занимаются в России и за рубежом, но которые могут послужить основой для принципиально нового подхода в точном распознавании речи – для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, развитие которых становится всё более актуальным.

Другие новости

22 февраля 2019

Ректор Томского государственного университета систем управления и радиоэлектроники Александр Шелупанов в числе первых подал заявку на участие команды вуза в образовательном интенсиве «Остров 10–22».

18 марта 2019

В Доме Правительства Российской Федерации состоялась торжественная церемония вручения премии Правительства в области науки и техники. Учёные ТУСУРа вошли в число лауреатов за разработку и внедрение интеллектуальной комплексной гетерогенной системы безопасности территориально удалённых объектов на основе адаптивного многоуровневого моделирования и упреждающего прогнозирования инцидентов.

05 марта 2019

На базе ТУСУРа состоялась очередная встреча консорциума университетов России, Европы и Азии, посвящённая созданию международной образовательной платформы CEPHEI (Cooperative e-learning Platform for Higher Education in Industrial Innovation) при поддержке европейской программы ERASMUS+. В рамках проекта ТУСУР формирует российский кейс для открытых онлайн-курсов.

14 марта 2019

На площадке студенческого бизнес-инкубатора Томского государственного университета систем управления и радиоэлектроники проходит модуль программы акселерации технологических проектов «AI & BIGDATA в медицине, образовании и нейротехнологиях».