Программистки разработали «деанонимизатор» для интернет-пользователей

 
31 103
11 января 2013 в 13:22
Автор: Ян Альшевский. Фото: Аркадий Соболев, scmagazine.com.au
Автор: Ян Альшевский. Фото: Аркадий Соболев, scmagazine.com.au

В рамках хакерской конференции 29C3 Chaos Communication Congress в Гамбурге была представлена техника для определения личности анонимных пользователей, оставляющих комментарии на форумах или аналогичных сервисах. Эффективность разработки Сади Афроз и Эйлин Калискан Ислам достигает 80%.

Система использует законы лингвистики и анализирует содержание текста, определяя служебные слова; также в методике применяется такой подход к анализу текста, как стилометрия — каждый человек использует одинаковые конструкции в научных работах и, например, общаясь в чате и на форуме, что и позволяет идентифицировать анонимного пользователя интернета.

По словам разработчиков, техника позволит успешно раскрывать личности владельцев ботнетов, авторов вирусов и иного вредоносного программного обеспечения.

Для отладки системы были просканированы тематические форумы и сообщения десятков тысяч авторов. Правда, для эффективного анализа ей требуется как минимум 5 тыс. слов, написанных одним человеком (по словам авторов, 6,5 тыс. является «золотой серединой»). Отмечается, что «деанонимизатор» работает только с английским языком, однако даже переводные тексты поддаются анализу (проблемы возникают с такими словами, как npuMep, Г|риме4ания, n00b и др., относящимися к стилю Leet).