Размер шрифта:
+
Цвет сайта:
Изображения:

Ученые из ТУСУРа представили проект по автоматизированной оценке речи на конференции в Стамбуле

25 сентября 2019
Ученые из ТУСУРа представили проект по автоматизированной оценке речи на конференции в Стамбуле

«SPECOM» («Conference on Speech and Computer») – престижная международная конференция, постоянными участниками которой выступают ученые ТУСУРа. В 2019 году мероприятие, посвященное вопросам компьютерной обработки речи, состоялось в Босфорском университете (Стамбул).

ТУСУР на конференции представляли доцент кафедры комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС), заместитель заведующего лабораторией медико-биологических исследований Евгений Костюченко и младший научный сотрудник этой лаборатории, преподаватель кафедры КИБЭВС Дарья Новохрестова.

Коллектив лаборатории медико-биологических исследований ТУСУРа совместно с НИИ онкологии ведет в рамках полученного гранта Российского Научного Фонда работы по восстановлению речевой функции у больных после хирургического лечения рака полости рта и ротоглотки.

– Задача, которую перед нами поставили – это создание методики оценки качества речи пациентов, – рассказывает Дарья Новохрестова. – Точнее, мы занимаемся автоматизацией этого процесса. Раньше те изменения, которые происходили в речи пациента после операции, оценивал эксперт, в нашей лаборатории мы разрабатываем программный комплекс, который позволит проводить оценку в автоматическом режиме. Изначально грант был рассчитан на три года, теперь его продлили еще на два.

Основная сложность, с которой столкнулись ученые из ТУСУРа, заключается в том, что алгоритмов такого анализа просто нет. ГОСТ по оценке разборчивости речи – еще 70-х годов прошлого века. За рубежом исследователи в этом направлении тоже делают первые шаги. Но в большинстве работ за основу берут именно экспертную оценку. Задача же наших ученых – полностью автоматизировать процесс.

– Год назад на базе НИИ онкологии заработала программа по оценке качества произношения слогов, – продолжает Дарья Новохрестова. – Пациент произносит слоги, программа их оценивает, сравнивая с эталоном – записями до операции. Дальше идут занятия с логопедом, через какое-то время мы оцениваем динамику восстановления речи. Если улучшений нет, доктора дают рекомендации и изменяют методику реабилитации.

Она добавила, что следующим шагом станет добавление в программу возможности оценки фразовой и словесной разборчивости. Для анализа экспертом эта работа гораздо сложнее, поскольку в слоге ошибку заметить легче, а фразу мозг часто достраивает автоматически.

– Мы рассмотрели три самых популярных системы распознавания речи – Google Cloud Speech-to-Text API, Яндекс SpeechKit и Voco от Центра речевых технологий (Санкт-Петербург). Google показал себя лучше остальных, но те результаты распознавания, которые системы нам предоставляют, существенно отличаются от того, что слышит эксперт, – отметила сотрудник лаборатории ТУСУРа.

На конференции в Стамбуле ученые представили свои доклады в формате постер-сессии, когда после краткого рассказа об исследовании, идет обсуждение данных, графиков и таблиц, размещенных на специальном постере. Для Дарьи Новохрестовой это был первый опыт участия в международной конференции.

– Мы вместе с коллегами выясняли, что может влиять на такой большой разброс оценок экспертов и систем распознавания. Подходили люди и подавали очень интересные идеи, какие параметры нужно отсмотреть, на что обратить внимание, как можно иначе интерпретировать оценки по распознаванию, – поделилась Дарья Новохрестова.  

Она также подчеркнула, что в настоящее время перед учеными ТУСУРа стоит задача внедрения версии программного обеспечения, где будет добавлена возможность оценки фразовой разборчивости. В НИИ онкологии, по ее словам, система заработает уже в сентябре-октябре. По результатам внедрения будет принято решение, оставлять в основе модуля оценки систему от Google или разрабатывать собственную.

Другие новости

19 апреля 2021

В рамках оперативно-профилактической операции «Дети России – 2021» эксперты ответили на вопросы первокурсников о последствиях потребления наркотиков.

30 апреля 2021

Томский госуниверситет систем управления и радиоэлектроники выступил одним из соорганизаторов XVIII Международной конференции студентов, аспирантов и молодых учёных «Перспективы развития фундаментальных наук».

29 апреля 2021

22–23 апреля в Томске прошла XVII Международная школа-конференция студентов, аспирантов и молодых ученых «Инноватика – 2021», соорганизатором которой выступил ТУСУР.

09 апреля 2021

Студенты и преподаватели кафедры радиотехнических систем ТУСУРа отпраздновали XI День кафедры. На мероприятии, прошедшем в Доме учёных 8 апреля, профессора и доценты кафедры наградили отличившихся студентов, а также выступили творческие коллективы университета.