Размер шрифта:
+
Цвет сайта:
Изображения:

Специалисты и студенты ТУСУРа разрабатывают способы определения искусственно созданных текстов, размещённых в Интернете

07 мая 2013
Представители университета планируют создать модели и алгоритмы, которые помогут не только определить текст, автоматически составленный специальной компьютерной программой, но и установить автора анонимного электронного послания по стилю написания.

Проблема текстов, искусственно созданных компьютерной программой, по мнению разработчиков, в настоящее время очень актуальна, так как для многих Интернет стал основным источником информации. В Сети люди читают новости, пишут комментарии, сами создают блоги.

«Долгое время Интернет воспринимался как источник информации, наиболее объективно отражающий картину мира. Но уже сегодня очевидно, что это не совсем так, - объясняет Роман Мещеряков, профессор кафедры комплексной информационной безопасности электронно-вычислительных систем ТУСУРа. – Существуют компьютерные системы, способные искусственно создавать тексты, обладающие правдоподобием, и есть системы, которые переписывают тексты. То есть достаточно написать одно сообщение, а подобные системы генерируют на его основе несколько якобы разных текстов и запускают от разных пользователей. Так можно в чьих-то интересах искусственно поднять не очень значимую тему. Мы разрабатываем механизм выявления таких текстов, позволяющий определить, что текст или полностью не принадлежит авторству человека, или поправлен автоматически».

Оригинальные модели и алгоритмы, которые тусуровцы планируют создать, должны будут выявлять стилистические особенности текста. Формальные критерии, определяющие, создан текст человеком или компьютером, предстоит разработать вместе со специалистами-гуманитариями: к работе над проектом уже присоединились сотрудники кафедры русского языка и общего языкознания филологического факультета НИ ТГУ.

«С помощью таких моделей и алгоритмов мы сможем решить ряд важных вопросов, помимо определения искусственно созданного текста, - добавляет Роман Мещеряков. – Возможно будет установить автора анонимки, присланной по электронной почте, или определить, набирал ли человек предсмертную записку на компьютере сам, или это сделал преступник. В этих случаях программа будет искать стилистические закономерности в разных текстах одного и того же человека и при отклонении от нормы указывать на это».

Пока проект находится в стадии разработки, но работающих аналогов к настоящему времени в мире нет, хотя многие специалисты активно занимаются поисками решения актуальной проблемы.

Материалы по теме

27 ноября 2017

Разработчики ТУСУРа представят на выставке научных достижений молодых учёных «Рост.UP» приложение полного контроля воспроизведения мультимедийного контента, созданное с помощью новейших технологий кроссплатформенной разработки.

11 декабря 2017

В рамках соглашения между ТУСУРом и департаментом социальной защиты населения Томской области в университете с сентября проходили курсы по основам компьютерной грамотности для неработающих пенсионеров, слушателями которых стали 177 томичей.

14 сентября 2017

Студенческий бизнес-инкубатор (СБИ) ТУСУРа «Дружба» объявил о наборе участников в акселератор #Unicorn2017 для проектов в сфере IT&Hardware.

18 января 2018

Новый метод обнаружения заключается в улавливании электромагнитного сигнала, который излучают двигатели беспилотников.