Размер шрифта:
+
Цвет сайта:
Изображения:

Специалисты и студенты ТУСУРа разрабатывают способы определения искусственно созданных текстов, размещённых в Интернете

07 мая 2013
Представители университета планируют создать модели и алгоритмы, которые помогут не только определить текст, автоматически составленный специальной компьютерной программой, но и установить автора анонимного электронного послания по стилю написания.

Проблема текстов, искусственно созданных компьютерной программой, по мнению разработчиков, в настоящее время очень актуальна, так как для многих Интернет стал основным источником информации. В Сети люди читают новости, пишут комментарии, сами создают блоги.

«Долгое время Интернет воспринимался как источник информации, наиболее объективно отражающий картину мира. Но уже сегодня очевидно, что это не совсем так, - объясняет Роман Мещеряков, профессор кафедры комплексной информационной безопасности электронно-вычислительных систем ТУСУРа. – Существуют компьютерные системы, способные искусственно создавать тексты, обладающие правдоподобием, и есть системы, которые переписывают тексты. То есть достаточно написать одно сообщение, а подобные системы генерируют на его основе несколько якобы разных текстов и запускают от разных пользователей. Так можно в чьих-то интересах искусственно поднять не очень значимую тему. Мы разрабатываем механизм выявления таких текстов, позволяющий определить, что текст или полностью не принадлежит авторству человека, или поправлен автоматически».

Оригинальные модели и алгоритмы, которые тусуровцы планируют создать, должны будут выявлять стилистические особенности текста. Формальные критерии, определяющие, создан текст человеком или компьютером, предстоит разработать вместе со специалистами-гуманитариями: к работе над проектом уже присоединились сотрудники кафедры русского языка и общего языкознания филологического факультета НИ ТГУ.

«С помощью таких моделей и алгоритмов мы сможем решить ряд важных вопросов, помимо определения искусственно созданного текста, - добавляет Роман Мещеряков. – Возможно будет установить автора анонимки, присланной по электронной почте, или определить, набирал ли человек предсмертную записку на компьютере сам, или это сделал преступник. В этих случаях программа будет искать стилистические закономерности в разных текстах одного и того же человека и при отклонении от нормы указывать на это».

Пока проект находится в стадии разработки, но работающих аналогов к настоящему времени в мире нет, хотя многие специалисты активно занимаются поисками решения актуальной проблемы.

Другие новости

16 мая 2019

В Томском государственном университете систем управления и радиоэлектроники участники научной игры Science Game из разных городов России прошли локации, связанные с основными научно-техническими направлениями вуза.

07 мая 2019

Томский государственный университет систем управления и радиоэлектроники выступил организатором секции «IT-технологии и электроника» XVI Международной конференции студентов, аспирантов и молодых учёных «Перспективы развития фундаментальных наук».

17 мая 2019

В рамках состоявшегося в ТУСУРе воркшопа «Формирование кооперации индустриальных компаний, университетов и НИИ для разработки модельной КНТП в области космических систем, технологий и услуг» форума U-NOVUS – 2019 прошла встреча участников проекта «Космический эксперимент «Рой малых космических аппаратов» на МКС».

25 апреля 2019

Разработчики ТУСУР, НЦ «Полюс» и ООО «Физикон Лаб» в рамках российского этапа чемпионата RoboCup Russia Open 2019 проведут апробацию взаимодействия робота-помощника учителя с участниками и посетителями мероприятия.