Ученые из ТУСУРа представили проект по автоматизированной оценке речи на конференции в Стамбуле

25 сентября 2019

«SPECOM» («Conference on Speech and Computer») – престижная международная конференция, постоянными участниками которой выступают ученые ТУСУРа. В 2019 году мероприятие, посвященное вопросам компьютерной обработки речи, состоялось в Босфорском университете (Стамбул).

ТУСУР на конференции представляли доцент кафедры комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС), заместитель заведующего лабораторией медико-биологических исследований Евгений Костюченко и младший научный сотрудник этой лаборатории, преподаватель кафедры КИБЭВС Дарья Новохрестова.

Коллектив лаборатории медико-биологических исследований ТУСУРа совместно с НИИ онкологии ведет в рамках полученного гранта Российского Научного Фонда работы по восстановлению речевой функции у больных после хирургического лечения рака полости рта и ротоглотки.

– Задача, которую перед нами поставили – это создание методики оценки качества речи пациентов, – рассказывает Дарья Новохрестова. – Точнее, мы занимаемся автоматизацией этого процесса. Раньше те изменения, которые происходили в речи пациента после операции, оценивал эксперт, в нашей лаборатории мы разрабатываем программный комплекс, который позволит проводить оценку в автоматическом режиме. Изначально грант был рассчитан на три года, теперь его продлили еще на два.

Основная сложность, с которой столкнулись ученые из ТУСУРа, заключается в том, что алгоритмов такого анализа просто нет. ГОСТ по оценке разборчивости речи – еще 70-х годов прошлого века. За рубежом исследователи в этом направлении тоже делают первые шаги. Но в большинстве работ за основу берут именно экспертную оценку. Задача же наших ученых – полностью автоматизировать процесс.

– Год назад на базе НИИ онкологии заработала программа по оценке качества произношения слогов, – продолжает Дарья Новохрестова. – Пациент произносит слоги, программа их оценивает, сравнивая с эталоном – записями до операции. Дальше идут занятия с логопедом, через какое-то время мы оцениваем динамику восстановления речи. Если улучшений нет, доктора дают рекомендации и изменяют методику реабилитации.

Она добавила, что следующим шагом станет добавление в программу возможности оценки фразовой и словесной разборчивости. Для анализа экспертом эта работа гораздо сложнее, поскольку в слоге ошибку заметить легче, а фразу мозг часто достраивает автоматически.

– Мы рассмотрели три самых популярных системы распознавания речи – Google Cloud Speech-to-Text API, Яндекс SpeechKit и Voco от Центра речевых технологий (Санкт-Петербург). Google показал себя лучше остальных, но те результаты распознавания, которые системы нам предоставляют, существенно отличаются от того, что слышит эксперт, – отметила сотрудник лаборатории ТУСУРа.

На конференции в Стамбуле ученые представили свои доклады в формате постер-сессии, когда после краткого рассказа об исследовании, идет обсуждение данных, графиков и таблиц, размещенных на специальном постере. Для Дарьи Новохрестовой это был первый опыт участия в международной конференции.

– Мы вместе с коллегами выясняли, что может влиять на такой большой разброс оценок экспертов и систем распознавания. Подходили люди и подавали очень интересные идеи, какие параметры нужно отсмотреть, на что обратить внимание, как можно иначе интерпретировать оценки по распознаванию, – поделилась Дарья Новохрестова.

Она также подчеркнула, что в настоящее время перед учеными ТУСУРа стоит задача внедрения версии программного обеспечения, где будет добавлена возможность оценки фразовой разборчивости. В НИИ онкологии, по ее словам, система заработает уже в сентябре-октябре. По результатам внедрения будет принято решение, оставлять в основе модуля оценки систему от Google или разрабатывать собственную.

Источник: пресс-служба ТУСУРа

Другие новости

Искусственный интеллект в биомедицинских системах: новая магистерская программа открывается в ТУСУРе

26 марта 2025

В 2025/26 учебном году в ТУСУРе впервые будет проходить набор магистрантов на программу «Искусственный интеллект в биомедицинских системах», созданную в рамках программы развития «Приоритет 2030».

ТУСУР и НИИ психического здоровья обучат нейросеть диагностировать шизофрению и депрессию

13 февраля 2025

Кафедра КИБЭВС Томского госуниверситета систем управления и радиоэлектроники совместно с НИИ психического здоровья Томского НИМЦ разработала технологию диагностики шизофрении и депрессии с помощью анализа невербального и вербального поведения пациентов. В настоящий момент в НИИ проводят сбор данных для обучения нейросети.

О работе ТУСУРа над геномным принтером рассказали в журнале об инновациях в России «Стимул»

20 марта 2025

Разработчики Томского госуниверситета систем управления и радиоэлектроники рассказали журналу «Стимул» о том, как велась работа над геномным принтером.

Александр Шелупанов: «Развитие квантовых коммуникаций – шанс на лидерство»

17 февраля 2025

Президент ТУСУРа рассказал, в каких направлениях развития квантовых технологий Россия может стать мировым лидером.

Ученые из ТУСУРа представили проект по автоматизированной оценке речи на конференции в Стамбуле

Другие новости

Актуально

Жизнь в ТУСУРе

Фотогалереи

Анонсы мероприятий

Видеогалерея