Учёные Томского государственного университета систем управления и радиоэлектроники исследуют малоизученную шёпотную речь человека для создания алгоритмов по распознаванию речи человека с высокой точностью.
На кафедре комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС) с помощью созданного здесь уникального математического аппарата проводятся исследования по распознаванию речи человека на уровне параметров речевого сигнала. Их результатом может стать создание новых алгоритмов, принципиально отличающихся от существующих, для корректного и более точного распознавания речи человека.
Как пояснил доцент кафедры КИБЭВС Антон Конев, речевые технологии в ближайшем будущем будут активно развиваться – для создания голосовых ассистентов, а также других новых продуктов в сфере искусственного интеллекта. Одна из главных целей разработчиков во всём мире – добиться полностью автоматического перевода устного текста любого объёма в письменный с высокой точностью, без искажений.
«Пока эта цель не достигнута, в том числе из-за подхода, который чаще всего используется в уже работающих человеко-машинных интерфейсах: голосовом поиске, чат-ботах, где распознаваемый максимум – это отдельные словосочетания, например, поисковые запросы или голосовой набор смс-сообщений», – говорит Антон Конев.
Суть этого подхода, по словам доцента ТУСУРа, – что основой распространённых алгоритмов является обучение на большом количестве примеров произнесённых звуков, слов, словосочетаний. При распознавании система вероятностным способом определяет, к какому из заложенных примеров ближе произнесённое. Определение параметров звуков с высокой точностью, свойственной слуховой системе человека, при создании не прорабатывается.
«Поэтому, как только человек начинает произносить не самые часто употребляемые слова, аббревиатуры, редкие имена, сокращения, распознавание ухудшается, и существующие системы ошибаются очень часто, – подчёркивает исследователь. – Кроме того, такие системы не учитывают вариативность окончаний и других особенностей спонтанной устной речи, а не отдельных коротких словосочетаний – особенна высока вариативность в русском языке, где «съедается» большой процент звуков, если мы говорим в привычном быстром темпе».
Поэтому своей задачей учёные кафедры КИБЭВС ТУСУРа называют определение более точных параметров звуков, в том числе с помощью изучения шёпотной речи.
Антон Конев
Есть классический термин – форманта, максимум звука в спектре, параметры которой нам необходимы, но в звучной речи на формантную структуру накладываются колебания и искажают картину форманты. Именно поэтому мы исследуем шёпотную речь, которая отделена от голосового источника и лишена этих искажений.
Исследования, проводимые с использованием уникальной разработки учёных кафедры КИБЭВС ТУСУРа – математического аппарата, учитывающего строение слуховой системы человека, показали, что распознавание ударных звуков шёпотной речи на основе общепринятых параметров возможно с надёжностью не менее 70 %.
Такой результат позволяет говорить о перспективности исследований для выявления точных параметров звуков, которыми мало занимаются в России и за рубежом, но которые могут послужить основой для принципиально нового подхода в точном распознавании речи – для создания усовершенствованных инструментов в сфере искусственного интеллекта, человеко-машинных интерфейсов, развитие которых становится всё более актуальным.
С 24 по 26 апреля в Санкт-Петербурге в конгрессно-выставочном центре «ЭКСПОФОРУМ» проходит Международная выставка инноваций HI-Tech, на которой Томский госуниверситет систем управления и радиоэлектроники представляет разработки учебных и резидентов СБИ.
В ПИШ ТУСУРа работают над созданием импульсного уровнемера для определения положения границ раздела многослойных жидких сред. Он может быть востребован в нефтяной промышленности.
В День российской науки руководители стартапов студенческого бизнес-инкубатора Томского госуниверситета систем управления и радиоэлектроники рассказали, как наука помогает в развитии технологического предпринимательства.
Николаю Патрушеву были представлены современные технологические разработки «Большого университета Томска».