Как российская «Фабрика троллей» пыталась влиять на повестку дня в Украине. Исследование 755 000 твитов
В середине октября компания «Twitter, Inc» опубликовала архив данных с более 9 миллионами твитов, которые по версии социальной сети причастны к российскому «Агентству Интернет-исследований». Возможно, такая открытость Интернет-гиганта связана с расследованием вмешательства российских спецслужб в выборы Президента США 2016 года.
VoxUkraine проанализировал более 750 000 твитов связанных с российским «Агентством интернет-исследований» и нашёл доказательства неоднократных информационных атак. Как работает российская пропаганда?
Опубликованный массив данных содержит информацию о 3667 аккаунтах, связанных с российским Агентством Интернет-исследований (известным также как «фабрика троллей»).
В VoxUkraine уже писали о влиянии российских twitter-ботов на британский референдум по Brexit: соучредители VoxUkraine Александр Талавера и Юрий Городниченко первыми научно доказали попытки россиян через Twitter повлиять на Brexit.
В VoxUkraine поставили перед собой задачу исследовать, были ли попытки со стороны аккаунтов, связанных с российским «Агентством Интернет-исследований», повлиять на мнение пользователей Твиттер относительно какого-либо украинского вопроса или события. Для этого мы нашли по ключевым словам 775 000 твитов, которые касались Украины. В исследовании мы проанализировали тематику твитов, определили наиболее популярные события для освещения за последние восемь лет и нашли аккаунты, которые твитили почти 33 часа подряд.
Что есть в 9 млн твитах, или как В VoxUkraine считали
В датасете 55% твитов на русском языке, 37% — на английском, а 8% — другие. VoxUkraine решил проанализировать, сколько сообщений непосредственно касались Украины. Для этого мы отфильтровали 9 млн твитов по ключевым словам, что с большой вероятностью маркируют сообщение, как имеющее отношение к Украине. Поиск по ключевым словам выявил почти 775 000 твитов.
Для выделения сообщений, кроме вариаций слова «Украина», искали твиты по актуальным украинским темам, персоналиям (например, Порошенко и Янукович) и ключевым нарративами российской пропаганды. Полный перечень слов-маркеров:«Юго-восток», «Донбасс», «Боинг», «МВФ», «Бандера», «бандеровцы», «каратель», «ополченец», «фашизм», «ВСУ», «Киев», «революция», «Майдан», «Крым», «Донецк», «Луганск», «Россия-Украина», «Порошенко», «Янукович», «гражданская война», «ДНР», «ЛНР», «народная республика», «Госдеп», «конфликт на Украине», «Минобороны Украины», «MH-17», «ГТС», «Тимошенко», «хохлы», «переселенцы».
Период поиска: январь 2010 — май 2018
Что это за аккаунты
За чуть более 8 лет в датасете из «Фабрики троллей» нашлось 774 957 твитов об Украине, которые сгенерировали 1369 аккаунтов (сейчас эти аккаунты удалены из соцсети). Твиттер анонимизировал аккаунты, которые имеют меньше 5000 подписчиков, поэтому мы можем увидеть реальные названия только 5% пользователей из базы. Последние можно классифицировать:
- страницы медиа: «Вестник Москвы», «Вестник Петербурга» (всего 24 региональных «Вестника»), «Федеральное агентство новостей», «Новини Києва»
- страницы с именем: «Максим Дементьев», «Мария Можайская»
- тематические страницы: «Рамзан Кадыров» (как указано в описании — пародийная страница), «Мюсли Лаврова», «Холодная война 2.0».
Наибольшее количество фолловеров имеют «Вестник Москвы» — 257 тыс, «Вестник Петербурга» — 149 тыс и «Максим Дементьев» — 134 тыс. Суммарное количество фолловеров в 1369 аккаунтов — 3,4 млн пользователей.
Чаще всего в описании сами владельцы аккаунтов пишут (то есть, мы не знаем их точные координаты), что они находятся в Москве (26%) и Санкт-Петербурге (16%), а 17% не указали местонахождение.
Пики активности
Первый твит из выборки датирован январем 2010 года, поэтому у нас есть возможность проанализировать активность «троллей» как до, так и после Революции Достоинства.
До начала Революции достоинства, в ноябре 2013 года и в течение следующих трех месяцев Украина почти не интересовала твиттер-троллей: аккаунты из нашей выборки демонстрировали очень низкую активность. К весне 2014 года все аккаунты суммарно публиковали в среднем 10 твитов в день, а максимальное количество публикаций за этот период было 28 октября 2012, в день выборов в Верховную Раду — 90 публикаций.
Отметку в 100 твитов в день пересекли на следующий день после «референдума» в Крыму — 17 марта 2014 года. В этот день аккаунты опубликовали 116 твитов, а 18 марта, в день аннексии Россией полуострова, — 129 твитов.
Более плодотворно аккаунты, связанные с российской фабрикой троллей, начали «работать» за два дня до президентских выборов в Украине 2014 года — 263 твита было опубликовано 23 мая. Следующие полгода количество твитов не падала меньше 115 в день.
Наибольшее количество твитов за восемь лет приходится на 18 июля 2014 — следующий день после катастрофы самолета MH-17. Тогда твиттер аккаунты «натвитили» более 44 тысячи сообщений, а в следующий — свыше 25 тысяч.
Красноречивый хэштег
Один из наиболее эффективных методов распространения твита и, соответственно, попадания в тренды Твиттера — прописывание хештегов. В нашей выборке мы нашли более 6200 различных хештегов. О чем они?
Наиболее популярными хештегами в твитах про Украину стали #ПровокацияКиева (22,3 тыс упоминаний), #КиевСбилБоинг (22,1 тыс) и #КиевСкажиПравду (21,9 тыс). Они пришлись именно на дни после катастрофы MH-17 — 18-20 июля. В кампании по продвижению этих хештегов принимали участие 327 аккаунтов. Учитывая, что аккаунты деперсонализированы, попробуем изучить их поведение в период 18-20 июля 2014 года.
Хэштег | Количество упоминаний |
---|---|
ПровокацияКиева | 22311 |
КиевСбилБоинг | 22104 |
КиевСкажиПравду | 21975 |
Украина | 20640 |
БитваОлигархов | 10004 |
новости | 8688 |
Россия | 8121 |
СекторБезГаза | 6882 |
Крым | 6089 |
КрымПутьНаРодину | 3000 |
Аккаунты-стахановцы
Первое, что бросается в глаза — количество твитов с одного аккаунта. Наиболее активный аккаунт из выборки за 18-19 июля (20-го не твитил) сделал суммарно 296 публикаций твитов и ретвитов. Как ни странно, подобных «стахановцев» много. Если сделать «рейтинг трудоголиков» 18-20 июля, то в него войдут 277 аккаунтов, сделавших 196 и более публикаций за эти дни.
Почему мы остановились на цифре 196? Потому что разрыв между количеством твитов у №277 и №278 в рейтинге — 155 публикаций. Поэтому мы продолжим исследовать 277 аккаунтов.
Как удалось одному человеку сделать 296 публикаций за два дня? Для этого надо, как минимум, быть очень выносливым человеком — этот аккаунт публиковал твиты без больших перерывов в течение 33 часов. В среднем каждый пост выходил каждые 6 минут и 42 секунды, а максимальный перерыв между публикациями был только 19 июля с 11:31 до 14:50. Как мы видим на визуализации, свыше 200 аккаунтов работали так же «ударно».
Можно предположить, что одним аккаунтом управляли несколько человек. Одно из подтверждений этого — способ публикации твитов. Обычно пользователи твитят непосредственно с сайта Твиттера или мобильного приложения. Такие твиты в датасете отмечались «Twitter Web Client» и «Twitter for Android / iOS».
Публиковать твиты можно с помощью специального приложения — клиент-сервиса. Это специальный сервис для публикации и управления одним или несколькими аккаунтами.
Для работы с несколькими аккаунтами можно использовать уже существующие клиент-сервисы или создать собственный — Твиттер позволяет разработчикам публиковать, редактировать, удалять и делать другие манипуляции не с сайта, а с помощью API. На протяжении июля наблюдается странная активность нескольких сервисов.
Например, с помощью программы для работы с Твиттер «token_app» пользователи твитили только в течение 7-19 июля 2014, а «twisofter» — в течение 16-19 июля. С помощью последнего сделали больше публикаций именно 18 и 19 июля — 19,3 и 11,2 тыс твитов (или 43% и 40% от общего количества в соответствующий день).
«Token-app» отстал не слишком сильно — 18,1 тыс и 10,4 тыс твитов (также 43% и 40% от общего количества в соответствующий день) 18 и 19 июля соответственно. Никакого упоминания об этих сервисах в поисковых системах не найдено. Существует вероятность, что эти клиент-сервисы были созданы только под конкретного заказчика или конкретную задачу и не промотировались широкой общественности, например, как новое приложение.
Контент
55% твитов из почти 775 тыс — уникальные, то есть не распространенные (ретвитнутые) сообщения из других аккаунтов.
К сожалению, 98% ретвитов сгенерировали анонимные аккаунты, поэтому мы не можем исследовать кто именно распространял контент. Однако мы можем проанализировать, какие страницы ретвитили наиболее активно и какой именно контент охотно распространяли.
Больше всего ретвитов на один пост собрал пользователь с ником «_drBre» (ныне удален). Он является автором первого и второго (632 и 537 RT соответственно) по распространению твитов среди нашей выборки. Третий в рейтинге — «Письма на фронт» (@frontlineletter).
Суммарно самыми популярными источниками ретвитов среди 1369 аккаунтов были российские СМИ. На первом месте «РИА Новости» (23 тыс ретвитов), на втором — «Федеральное агентство новостей» (16 тыс) и замыкает тройку лидеров «Russia Today» (14 тыс).
Российские СМИ собирали не так много ретвитов отдельных постов. Например, лидер по суммарному количеству распространений, «РИА Новости», максимум имели 19 ретвитов на один пост. В 4 раза больше имело «Федеральное агентство новостей» — 80. Однако здесь интересны даже не количество ретвитов, лайков и даже контент. Время публикаций — еще одно подтверждение управления несколькими аккаунтами одним человеком.
18 из 19 аккаунтов, которые ретвитнули пост «РИА Новости», сделали это одновременно — в 16:25 28 сентября 2015 года. У «Федерального агентства новостей» схожая ситуация: самый распространяемый твит (80 RT) публиковался 45 различными аккаунтами в 16:34 17 июля 2014 и 35 другими аккаунтами в 16:43 того же дня.
Выводы
- За чуть более 8 лет в датасете из «Фабрики троллей» мы нашли 774 957 твитов об Украине, которые сгенерировали 1369 аккаунтов. До аннексии Крыма твиттер-боты почти не проявляли активность: максимальное количество публикаций за 2010-2013 годы была в день выборов в Верховную Раду 2012-го (90 твитов). Более массово аккаунты из выборки начали твитить уже в конце мая 2014-го: перед президентскими выборами (23 мая) было опубликовано 263 твитов. Следующие полгода количество твитов не падало меньше 115 в день.
- Настоящий «твиттер-шторм» состоялся 18 июля 2014 — следующий день после катастрофы самолета MH-17. В тот день аккаунты «натвитили» более 44 000 сообщений, а в следующий — более 25 000. Тогда 297 аккаунтов продвигали информацию о якобы виновности Украины в том, что Боинг был сбит, с помощью хештегов # ПровокацияКиева (22,3 тыс упоминаний), # КиевСбилБоинг (22 1 тыс) и # КиевСкажиПравду (21,9 тыс).
- Более 200 аккаунтами руководили централизованно. Кроме того, что сам Твиттер связывает все аккаунты из датасета с «Агентством Интернет-исследований», мы нашли два подтверждения одного владельца нескольких аккаунтов. В июле наблюдается странная активность нескольких клиент-сервисов для работы с Твиттером. Например, с помощью программы, которая имеет маркировку «twisofter», твитили только в течение 16-19 июля 2014 года. Больше публикаций было сделано 18 и 19 июля — 19,3 и 11,2 тыс твитов (или 43% и 40% от общего количества в соответствующий день). Такая же история с сервисом с маркировкой «token_app». Никакого упоминания об этих сервисах в поисковых системах не найдено, соответственно, существует вероятность, что эти клиент-сервисы были созданы только под конкретную задачу.
- Второе подтверждение — контентное. 18 из 19 аккаунтов, которые ретвитнули наиболее распространяемый за восемь лет пост «РИА Новости», сделали это одновременно — в 16:25 28 сентября 2015. Такая же ситуация у «Федерального агентства новостей». Наиболее популярный по ретвитам их пост (80 RT) публиковался 45 различными аккаунтами в 16:34 17 июля 2014 и 35 другими аккаунтами в 16:43 того же дня.
Автор: Александр Надельнюк; VoxUkraine