Размер шрифта:
+
Цвет сайта:
Изображения:

Специалисты и студенты ТУСУРа разрабатывают способы определения искусственно созданных текстов, размещённых в Интернете

07 мая 2013
Представители университета планируют создать модели и алгоритмы, которые помогут не только определить текст, автоматически составленный специальной компьютерной программой, но и установить автора анонимного электронного послания по стилю написания.

Проблема текстов, искусственно созданных компьютерной программой, по мнению разработчиков, в настоящее время очень актуальна, так как для многих Интернет стал основным источником информации. В Сети люди читают новости, пишут комментарии, сами создают блоги.

«Долгое время Интернет воспринимался как источник информации, наиболее объективно отражающий картину мира. Но уже сегодня очевидно, что это не совсем так, - объясняет Роман Мещеряков, профессор кафедры комплексной информационной безопасности электронно-вычислительных систем ТУСУРа. – Существуют компьютерные системы, способные искусственно создавать тексты, обладающие правдоподобием, и есть системы, которые переписывают тексты. То есть достаточно написать одно сообщение, а подобные системы генерируют на его основе несколько якобы разных текстов и запускают от разных пользователей. Так можно в чьих-то интересах искусственно поднять не очень значимую тему. Мы разрабатываем механизм выявления таких текстов, позволяющий определить, что текст или полностью не принадлежит авторству человека, или поправлен автоматически».

Оригинальные модели и алгоритмы, которые тусуровцы планируют создать, должны будут выявлять стилистические особенности текста. Формальные критерии, определяющие, создан текст человеком или компьютером, предстоит разработать вместе со специалистами-гуманитариями: к работе над проектом уже присоединились сотрудники кафедры русского языка и общего языкознания филологического факультета НИ ТГУ.

«С помощью таких моделей и алгоритмов мы сможем решить ряд важных вопросов, помимо определения искусственно созданного текста, - добавляет Роман Мещеряков. – Возможно будет установить автора анонимки, присланной по электронной почте, или определить, набирал ли человек предсмертную записку на компьютере сам, или это сделал преступник. В этих случаях программа будет искать стилистические закономерности в разных текстах одного и того же человека и при отклонении от нормы указывать на это».

Пока проект находится в стадии разработки, но работающих аналогов к настоящему времени в мире нет, хотя многие специалисты активно занимаются поисками решения актуальной проблемы.

Материалы по теме

12 апреля 2018

Разработчики ТУСУРа создают доступные аппараты для проведения исследований и работ в стратосфере, условно называемой ближним космосом.

12 апреля 2018

В ТУСУРе накануне Всемирного дня авиации и космонавтики отправили в стратосферу метеозонд, на котором закрепили фотографию молодых разработчиков студенческого бизнес-инкубатора вуза, поздравляющих с профессиональным праздником всех причастных к нему людей.

26 марта 2018

Проект Томского государственного университета систем управления и радиоэлектроники по развитию инициативы продвижения робототехнических соревнований RoboCup в СНГ единогласно поддержал совет кластера SMART Technologies Tomsk.

24 апреля 2018

ТУСУР выступил соорганизатором международной конференции студентов, аспирантов и молодых учёных «Перспективы развития фундаментальных наук».