«SPECOM» («Conference on Speech and Computer») – престижная международная конференция, постоянными участниками которой выступают ученые ТУСУРа. В 2019 году мероприятие, посвященное вопросам компьютерной обработки речи, состоялось в Босфорском университете (Стамбул).
ТУСУР на конференции представляли доцент кафедры комплексной информационной безопасности электронно-вычислительных систем (КИБЭВС), заместитель заведующего лабораторией медико-биологических исследований Евгений Костюченко и младший научный сотрудник этой лаборатории, преподаватель кафедры КИБЭВС Дарья Новохрестова.
Коллектив лаборатории медико-биологических исследований ТУСУРа совместно с НИИ онкологии ведет в рамках полученного гранта Российского Научного Фонда работы по восстановлению речевой функции у больных после хирургического лечения рака полости рта и ротоглотки.
– Задача, которую перед нами поставили – это создание методики оценки качества речи пациентов, – рассказывает Дарья Новохрестова. – Точнее, мы занимаемся автоматизацией этого процесса. Раньше те изменения, которые происходили в речи пациента после операции, оценивал эксперт, в нашей лаборатории мы разрабатываем программный комплекс, который позволит проводить оценку в автоматическом режиме. Изначально грант был рассчитан на три года, теперь его продлили еще на два.
Основная сложность, с которой столкнулись ученые из ТУСУРа, заключается в том, что алгоритмов такого анализа просто нет. ГОСТ по оценке разборчивости речи – еще 70-х годов прошлого века. За рубежом исследователи в этом направлении тоже делают первые шаги. Но в большинстве работ за основу берут именно экспертную оценку. Задача же наших ученых – полностью автоматизировать процесс.
– Год назад на базе НИИ онкологии заработала программа по оценке качества произношения слогов, – продолжает Дарья Новохрестова. – Пациент произносит слоги, программа их оценивает, сравнивая с эталоном – записями до операции. Дальше идут занятия с логопедом, через какое-то время мы оцениваем динамику восстановления речи. Если улучшений нет, доктора дают рекомендации и изменяют методику реабилитации.
Она добавила, что следующим шагом станет добавление в программу возможности оценки фразовой и словесной разборчивости. Для анализа экспертом эта работа гораздо сложнее, поскольку в слоге ошибку заметить легче, а фразу мозг часто достраивает автоматически.
– Мы рассмотрели три самых популярных системы распознавания речи – Google Cloud Speech-to-Text API, Яндекс SpeechKit и Voco от Центра речевых технологий (Санкт-Петербург). Google показал себя лучше остальных, но те результаты распознавания, которые системы нам предоставляют, существенно отличаются от того, что слышит эксперт, – отметила сотрудник лаборатории ТУСУРа.
На конференции в Стамбуле ученые представили свои доклады в формате постер-сессии, когда после краткого рассказа об исследовании, идет обсуждение данных, графиков и таблиц, размещенных на специальном постере. Для Дарьи Новохрестовой это был первый опыт участия в международной конференции.
– Мы вместе с коллегами выясняли, что может влиять на такой большой разброс оценок экспертов и систем распознавания. Подходили люди и подавали очень интересные идеи, какие параметры нужно отсмотреть, на что обратить внимание, как можно иначе интерпретировать оценки по распознаванию, – поделилась Дарья Новохрестова.
Она также подчеркнула, что в настоящее время перед учеными ТУСУРа стоит задача внедрения версии программного обеспечения, где будет добавлена возможность оценки фразовой разборчивости. В НИИ онкологии, по ее словам, система заработает уже в сентябре-октябре. По результатам внедрения будет принято решение, оставлять в основе модуля оценки систему от Google или разрабатывать собственную.
Сотрудники Томского госуниверситета систем управления и радиоэлектроники прошли стажировки в организациях, занимающихся генетическими технологиями.
В 2025/26 учебном году в ТУСУРе впервые будет проходить набор магистрантов на программу «Искусственный интеллект в биомедицинских системах», созданную в рамках программы развития «Приоритет 2030».
Кафедра КИБЭВС Томского госуниверситета систем управления и радиоэлектроники совместно с НИИ психического здоровья Томского НИМЦ разработала технологию диагностики шизофрении и депрессии с помощью анализа невербального и вербального поведения пациентов. В настоящий момент в НИИ проводят сбор данных для обучения нейросети.
Разработчики Томского госуниверситета систем управления и радиоэлектроники рассказали журналу «Стимул» о том, как велась работа над геномным принтером.