Размер шрифта:
+
Цвет сайта:
Изображения:

Ученые из ТУСУРа представили проект по автоматизированной оценке речи на конференции в Стамбуле

25 сентября 2019
Ученые из ТУСУРа представили проект по автоматизированной оценке речи на конференции в Стамбуле

«SPECOM» («Conference on Speech and Computer») – престижная международная конференция, постоянными участниками которой выступают ученые ТУСУРа. В 2019 году мероприятие, посвященное вопросам компьютерной обработки речи, состоялось в Босфорском университете (Стамбул).

ТУСУР на конференции представляли доцент кафедры комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС), заместитель заведующего лабораторией медико-биологических исследований Евгений Костюченко и младший научный сотрудник этой лаборатории, преподаватель кафедры КИБЭВС Дарья Новохрестова.

Коллектив лаборатории медико-биологических исследований ТУСУРа совместно с НИИ онкологии ведет в рамках полученного гранта Российского Научного Фонда работы по восстановлению речевой функции у больных после хирургического лечения рака полости рта и ротоглотки.

– Задача, которую перед нами поставили – это создание методики оценки качества речи пациентов, – рассказывает Дарья Новохрестова. – Точнее, мы занимаемся автоматизацией этого процесса. Раньше те изменения, которые происходили в речи пациента после операции, оценивал эксперт, в нашей лаборатории мы разрабатываем программный комплекс, который позволит проводить оценку в автоматическом режиме. Изначально грант был рассчитан на три года, теперь его продлили еще на два.

Основная сложность, с которой столкнулись ученые из ТУСУРа, заключается в том, что алгоритмов такого анализа просто нет. ГОСТ по оценке разборчивости речи – еще 70-х годов прошлого века. За рубежом исследователи в этом направлении тоже делают первые шаги. Но в большинстве работ за основу берут именно экспертную оценку. Задача же наших ученых – полностью автоматизировать процесс.

– Год назад на базе НИИ онкологии заработала программа по оценке качества произношения слогов, – продолжает Дарья Новохрестова. – Пациент произносит слоги, программа их оценивает, сравнивая с эталоном – записями до операции. Дальше идут занятия с логопедом, через какое-то время мы оцениваем динамику восстановления речи. Если улучшений нет, доктора дают рекомендации и изменяют методику реабилитации.

Она добавила, что следующим шагом станет добавление в программу возможности оценки фразовой и словесной разборчивости. Для анализа экспертом эта работа гораздо сложнее, поскольку в слоге ошибку заметить легче, а фразу мозг часто достраивает автоматически.

– Мы рассмотрели три самых популярных системы распознавания речи – Google Cloud Speech-to-Text API, Яндекс SpeechKit и Voco от Центра речевых технологий (Санкт-Петербург). Google показал себя лучше остальных, но те результаты распознавания, которые системы нам предоставляют, существенно отличаются от того, что слышит эксперт, – отметила сотрудник лаборатории ТУСУРа.

На конференции в Стамбуле ученые представили свои доклады в формате постер-сессии, когда после краткого рассказа об исследовании, идет обсуждение данных, графиков и таблиц, размещенных на специальном постере. Для Дарьи Новохрестовой это был первый опыт участия в международной конференции.

– Мы вместе с коллегами выясняли, что может влиять на такой большой разброс оценок экспертов и систем распознавания. Подходили люди и подавали очень интересные идеи, какие параметры нужно отсмотреть, на что обратить внимание, как можно иначе интерпретировать оценки по распознаванию, – поделилась Дарья Новохрестова.  

Она также подчеркнула, что в настоящее время перед учеными ТУСУРа стоит задача внедрения версии программного обеспечения, где будет добавлена возможность оценки фразовой разборчивости. В НИИ онкологии, по ее словам, система заработает уже в сентябре-октябре. По результатам внедрения будет принято решение, оставлять в основе модуля оценки систему от Google или разрабатывать собственную.

Другие новости

10 июля 2020

Сборник «Инновации в информационных науках и технологиях» (Innovations in Information and Communication Science and Technology, IICST 2020) по итогам международной конференции, организатором которой выступил ТУСУР, проиндексирован международной наукометрической базой данных Scopus.

24 июля 2020

28 июля школьники смогут узнать, из каких этапов состоит разработка сайтов, и попробуют свои силы в создании сайта-визитки.

30 июля 2020

Алхадж Хасан Аднан приехал в Томск, чтобы поступить в аспирантуру ТУСУРа. До этого Аднан три года проучился в Тамбове, куда прибыл из Сирии. Из всех стран Аднан выбрал именно Россию потому, что отношения между государствами дружеские.

13 июля 2020

Ректор ТУСУРа Виктор Рулевский, курирующий в Томском консорциуме научно-образовательных и научных организаций направление экспорта образования, рассказал в интервью для «Эксперт – Сибирь», как решается задача по формированию единой «точки входа», которая будет транслировать возможности уникального томского научно-образовательного центра и привлекать абитуриентов со всего мира.