Размер шрифта:
+
Цвет сайта:
Изображения:

Учёные ТУСУРа изучают шёпот, чтобы научить компьютер более точно распознавать человеческую речь

07 февраля 2018
Учёные ТУСУРа изучают шёпот, чтобы научить компьютер более точно распознавать человеческую речь

Учёные Томского государственного университета систем управления и радиоэлектроники исследуют малоизученную шёпотную речь человека для создания алгоритмов по распознаванию речи человека с высокой точностью.

На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала. Их результатом может стать создание новых алгоритмов, принципиально отличающихся от существующих, для корректного и более точного распознавания речи человека.

Как пояснил доцент кафедры КИБЭВС Антон Конев, речевые технологии в ближайшем будущем будут активно развиваться – для создания голосовых ассистентов, а также других новых продуктов в сфере искусственного интеллекта. Одна из главных целей разработчиков во всём мире – добиться полностью автоматического перевода устного текста любого объёма в письменный с высокой точностью, без искажений.

«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», – говорит Антон Конев.

Суть этого подхода, по словам доцента ТУСУРа, – что основой распространённых алгоритмов является обучение на большом количестве примеров произнесённых звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесённое. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.

«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается, и существующие системы ошибаются очень часто, – подчёркивает исследователь. – Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе».

Поэтому своей задачей учёные кафедры КИБЭВС ТУСУРа называют определение более точных параметров звуков, в том числе с помощью изучения шёпотной речи.

Антон Конев

Есть классический термин – форманта, максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шёпотную речь, которая отделена от голосового источника и лишена этих искажений.

Исследования, проводимые с использованием уникальной разработки учёных кафедры КИБЭВС ТУСУРа – математического аппарата, учитывающего строение слуховой системы человека, показали, что распознавание ударных звуков шёпотной речи на основе общепринятых параметров возможно с надёжностью не менее 70 %.

Такой результат позволяет говорить о перспективности исследований для выявления точных параметров звуков, которыми мало занимаются в России и за рубежом, но которые могут послужить основой для принципиально нового подхода в точном распознавании речи – для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, развитие которых становится всё более актуальным.

Другие новости

19 июня 2019

Томская компания Neuromech, выросшая из проекта ТУСУРа по созданию человекоподобного робота, разработала программно-аппаратный комплекс для обучения детей с расстройствами аутического спектра (РАС). Помогать детям будут роботы и нейроинтерфейсы.

18 июня 2019

Ректор Томского государственного университета систем управления и радиоэлектроники Александр Шелупанов рассказал на брифинге в медиацентре РИА «Томск» об итогах работы университета за пять лет (2014 – 2019 гг.) и обозначил главные задачи на ближайшее время.

24 июня 2019

6 июля спортивно-технический клуб аквалангистов «Наяда» ТУСУРа отправится в научно-исследовательскую экспедицию в Хакасию, которая станет первой по уровню сложности погружений для Томской области.

19 июня 2019

В ТУСУРе школьникам Томского физико-технического лицея вручили сертификаты об окончании летней сессии языковой школы, которая проводится в рамках совместного проекта «Созвездие» ТУСУРа, «Микрана» и ТФТЛ.