Размер шрифта:
+
Цвет сайта:
Изображения:

Пресс-релиз от 30 апреля 2013г. Специалисты и студенты ТУСУРа разрабатывают способы определения искусственно созданных текстов, размещённых в Интернете

07 мая 2013
Представители университета планируют создать модели и алгоритмы, которые помогут не только определить текст, автоматически составленный специальной компьютерной программой, но и установить автора анонимного электронного послания по стилю написания.

Проблема искусственно созданных компьютерной программой текстов, по мнению разработчиков, в настоящее время очень актуальна, так как для многих Интернет стал основным источником информации. В Сети люди читают новости, пишут комментарии, сами создают блоги.

- Долгое время Интернет воспринимался как источник информации, наиболее объективно отражающий картину мира. Но уже сегодня очевидно, что это не совсем так, - объясняет Роман Мещеряков, профессор кафедры комплексной информационной безопасности электронно-вычислительных систем ТУСУРа. - Существуют компьютерные системы, способные искусственно создавать тексты, обладающие правдоподобием, и есть системы, которые переписывают тексты. То есть достаточно написать одно сообщение, а подобные системы генерируют на его основе несколько якобы разных текстов и запускают от разных пользователей. Так можно в чьих-то интересах искусственно поднять не очень значимую тему. Мы разрабатываем механизм выявления таких текстов, позволяющий определить, что текст или полностью не принадлежит авторству человека, или поправлен автоматически.

Оригинальные модели и алгоритмы, которые тусуровцы планируют создать, должны будут выявлять стилистические особенности текста. Формальные критерии, определяющие создан текст человеком или компьютером, предстоит разработать вместе со специалистами-гуманитариями: к работе над проектом уже присоединились сотрудники кафедры русского языка и общего языкознания филологического факультета НИ ТГУ.

- С помощью таких моделей и алгоритмов мы сможем решить ряд важных вопросов, помимо определения искусственно созданного текста, - добавляет Роман Мещеряков. - Возможно будет установить автора анонимки, присланной по электронной почте, или определить, набирал ли человек предсмертную записку на компьютере сам или это сделал преступник. В этих случаях программа будет искать стилистические закономерности в разных текстах одного и того же человека, и при отклонении от нормы указывать на это.

Пока проект находится в стадии разработки, но подобных работающих аналогов к настоящему времени нет и в мире, хотя многие специалисты активно занимаются поисками решения актуальной проблемы.

НАВЕРХ