Український Тиждень

Як протистояти російським наративам у мережі, застосовуючи сучасні методи Data Science та алгоритми машинного навчання.

Можна стверджувати зі стовідсотковою впевненістю, що росіяни для досягнення своїх цілком прагматичних геополітичних цілей використовують усі можливі засоби, зокрема найсучасніші ІТ-розробки: технології опрацювання Big Data, алгоритми машинного навчання, нейромережі. Москву, слід сказати, небезпідставно звинувачують у тому, що вона, застосовуючи ці досягнення, втручалася в президентські вибори США. У цьому контексті не треба забувати й про скандал із британською Cambridge Analytica, яка допомогла Дональду Трампу завоювати прихильність примхливої американської аудиторії в соціальних мережах.

Але, повертаючись до всюдисущих росіян, варто наголосити, що вони не обмежувалися у своїх спробах спотворити медіа-простір тільки Україною чи Америкою, а взялися й за Німеччину, яка давно входить до сфери інтересів Москви. Власне, пошук російського сліду в німецькому медіа-просторі й став темою мого дослідження в межах курсу «Data Science. Обробка природної мови» від викладачів успішного українського стартапу Grammarly.

Якось, читаючи статтю про перебіг президентських виборів в Україні в провідному німецькому виданні Zeit Online, я звернув увагу на те, що журналіст написав її досить збалансовано, а от коментарі під нею буква в букву повторювали штампи російської пропаганди про Україну. І що далі я занурювався в мереживо цього не дуже приємного чтива, то більше розумів, що Україну тут змальовують у тих самих тонах, що й мешканцям Росії. Згодом я взяв іншу статтю цього видання про Україну, потім ще одну. Відверто кажучи, змінювалися події, автори, але непорушною була підкреслено антиукраїнська тональність абсолютної більшості коментарів.

Для того щоб зрозуміти, як усе ж таки Росія перекручувала дійсність про Україну для німецького читача, було вирішено повернутися до початків. Для аналізу я взяв коментарі під 22 статтями із Zeit Online за період від початку січня по березень 2014 року. Тобто це фактично розпал Революції гідності та початок анексії Криму. Такий вибір не випадковий, адже саме із цієї точки можна простежити витоки сучасної демонізації України в Німеччині. Всього було отримано 1200 коментарів. Це досить значний датасет (кількість даних), більш ніж достатній для аналізу за допомогою сучасних технологій Data Science та Machine Learning.

Для початку я поміряв відстань між векторами статті "Sieben Irrtümer über die Revolution in Kiew" та коментарями під нею. Простіше кажучи, визначив, наскільки інформація, викладена в коментарях, відповідає контексту статті. Як показали цифри, дива не сталося: більшість коментарів були зовсім не за темою і відверто негативної тональності. Почавши аналізувати їх детальніше, зустрічаємо до болю знайомі фрази: «проплачені демонстранти», «неонацисти», «революція, організована за гроші Держпепу», «продовження кольорової революції», «озброєні демонстранти нападають на Беркут» і так далі. Підкреслюю: автор пише про поширені помилки німецького суспільства в розумінні Революції гідності, натомість його статтю повністю спотворюють коментарями з уже загальновідомими антиукраїнськими мемами.

Як показав повний векторний аналіз, розбіжність між тим, про що йшлося в статті, та коментарями просто величезна. Тролі вперто насаджували свій погляд. З іншими статтями та сама історія. Як результат — маємо ситуацію, де журналісти об'єктивно пишуть про події в Україні, але під їхні матеріали набігають тролі, які відразу змінюють акценти й тональність поданої інформації. Після цього я провів біграмний аналіз на найуживаніші словосполучення в тролінгових коментарях. Якщо з «фашистами», «путчем», «переворотом» усе й так зрозуміло, то наявність «Косово» може видатися недоречною або дивною. Але це тільки на перший погляд. Проаналізувавши контекст, у якому це слово вживалося, стало зрозуміло, що російські тролі використовували ситуацію з проголошенням незалежності Косово як виправдання анексії Криму.

Untitled-1.jpg

Мовляв, США перші порушили міжнародні договори, надавши Косово незалежність, то чому Росії не можна взяти те, що й так їй належить. Цікавим та одночасно самовикривальним є й негативне забарвлення слова «санкції». Коментатори також не відзначалися особливим креативом стосовно позиції Росії щодо Криму, вони просто повторювали німцям мантри «Крим був завжди російським», «Хрущов подарував Крим Україні тимчасово», «населення Криму за Росію», «референдум показав справжні настрої кримчан», «Крим завжди прагнув до Росії». Після проведення додаткових дій із текстом, як-от лематизація, очищення від stopwords, позбавлення від найчастіше повторюваних сутностей, було визначено десять найактивніших тролів.

Untitled-2.jpg

Наступним завданням стало визначити, наскільки персоналізованими є коментарі від цих тролів. Мається на увазі, як часто вони вживають словосполучення, які виражають особисте ставлення до події чи людини, наприклад «я думаю», «я вважаю», «моя думка щодо цього така», «мені здається». І от що з'ясувалося: тільки 6% з усіх коментарів містять схожі звороти. Тролі подають свою дезінформацію в суто стверджувальному тоні.

Untitled-3.jpg

І на завершення аналізу пропоную поглянути на найуживаніші слова в коментарях цих десяти тролів.

Окрім стандартного російського набору фраз «референдум», «фашисти», «нацисти», «націоналісти» часто зустрічається слово "Bürgerkrieg", що в перекладі означає «громадянська війна». Хочу нагадати, що період аналізу коментарів: січень — початок березня 2014 року. Тобто до воєнних дій на Донбасі росіяни вже насаджували німцям думку, що «в Україні відбувається громадянська війна». Усе це було добре продумано та підготовлено заздалегідь.

І наостанок. Лише уявіть собі масштаби дезінформаційної кампанії, спрямованої проти України загалом у Німеччині. Ключові пропагандистські слова, які використовували російські боти/тролі для розпалювання ситуації в Україні, повністю відповідають тим, що були встановлені під час аналізу коментарів Zeit Online. Стовідсотковий збіг.

Анатолій Шара́