ОПОРА продовжує розробляти та публікувати свої технічні рішення для збору й аналізу даних із соціальних мереж.
Наша мета — зробити процес моніторингу більш зрозумілим та доступним, а також автоматизувати більшість його етапів. Ми прагнемо, щоб навіть ті, хто не має глибоких технічних знань, могли використовувати інструменти для роботи з даними. Раніше ми вже розповідали, як можна аналізувати рекламу у соціальних мережах Meta (Facebook, Instagram тощо).
Сьогодні ми публікуємо наш код, за допомогою якого ви можете перевірити, наскільки схожими є повідомлення у різних телеграм-каналах чи твіттер-акаунтах. Наприклад, якщо вам здається, що якесь повідомлення на одному каналі підозріло схоже на повідомлення з іншого каналу, то за допомогою цього коду ви можете перевірити, наскільки часто дублюються повідомлення цих каналів.
Код доступний у середовищі Google Colab та містить додаткові інструкції з використання всередині: КОД
Щоб скористатися ним, скопіюйте цей записник у ваш робочий простір: “Файл” → “Зберегти копію на Диску”.
Код стане в пригоді дослідникам, які шукають ефективних способів обробки великих обсягів інформації.
У квітні цього року ОПОРА опублікувала дослідження, зроблене з використанням цього коду. Завдяки йому ми зʼясували, що 53% повідомлень із проросійських телеграм-каналів на тимчасово окупованих територіях України не є оригінальними, а просто дублюють інформацію одне одного.
Якщо у вас виникнуть запитання, звертайтеся за допомогою на нашу офіційну скриньку [email protected] або до нашої дослідницької команди напряму ([email protected], [email protected]).