Размер шрифта:
+
Цвет сайта:
Изображения:

Специалисты и студенты ТУСУРа разрабатывают способы определения искусственно созданных текстов, размещённых в Интернете

07 мая 2013
Представители университета планируют создать модели и алгоритмы, которые помогут не только определить текст, автоматически составленный специальной компьютерной программой, но и установить автора анонимного электронного послания по стилю написания.

Проблема текстов, искусственно созданных компьютерной программой, по мнению разработчиков, в настоящее время очень актуальна, так как для многих Интернет стал основным источником информации. В Сети люди читают новости, пишут комментарии, сами создают блоги.

«Долгое время Интернет воспринимался как источник информации, наиболее объективно отражающий картину мира. Но уже сегодня очевидно, что это не совсем так, - объясняет Роман Мещеряков, профессор кафедры комплексной информационной безопасности электронно-вычислительных систем ТУСУРа. – Существуют компьютерные системы, способные искусственно создавать тексты, обладающие правдоподобием, и есть системы, которые переписывают тексты. То есть достаточно написать одно сообщение, а подобные системы генерируют на его основе несколько якобы разных текстов и запускают от разных пользователей. Так можно в чьих-то интересах искусственно поднять не очень значимую тему. Мы разрабатываем механизм выявления таких текстов, позволяющий определить, что текст или полностью не принадлежит авторству человека, или поправлен автоматически».

Оригинальные модели и алгоритмы, которые тусуровцы планируют создать, должны будут выявлять стилистические особенности текста. Формальные критерии, определяющие, создан текст человеком или компьютером, предстоит разработать вместе со специалистами-гуманитариями: к работе над проектом уже присоединились сотрудники кафедры русского языка и общего языкознания филологического факультета НИ ТГУ.

«С помощью таких моделей и алгоритмов мы сможем решить ряд важных вопросов, помимо определения искусственно созданного текста, - добавляет Роман Мещеряков. – Возможно будет установить автора анонимки, присланной по электронной почте, или определить, набирал ли человек предсмертную записку на компьютере сам, или это сделал преступник. В этих случаях программа будет искать стилистические закономерности в разных текстах одного и того же человека и при отклонении от нормы указывать на это».

Пока проект находится в стадии разработки, но работающих аналогов к настоящему времени в мире нет, хотя многие специалисты активно занимаются поисками решения актуальной проблемы.

Материалы по теме

31 июля 2018

В ТУСУРе стартуют курсы, посвящённые созданию роботов, изучению нейрокомпьютерных интерфейсов и современных инструментов программирования.

09 августа 2018

Томский государственный университет систем управления и радиоэлектроники в рамках приёмной кампании 2018 года принял 8,7 тысячи заявлений от абитуриентов.

08 августа 2018

Учёные Центра космического мониторинга Земли (ЦКМЗ) ТУСУРа создают интеллектуальную систему, способную самостоятельно проводить анализ долговременных изменений, происходящих на больших территориях, выявляя из них природные и антропогенные.

25 июля 2018

В Томском государственном университете систем управления и радиоэлектроники разрабатывают технологии, повышающие надёжность и эффективность работы установки для импульсной электронно-лучевой обработки поверхности диэлектриков: керамики, стекла, полимеров.