Визначення авторства анонімних українськомовних текстів у мережі інтернет

29.03.2024 14:00

29 березня, 14:00 - презентація проєкту «Визначення авторства анонімних українськомовних текстів у мережі інтернет».

Організатор: Український науковий центр лінгвістичних студій.

Спікери: Наталія Дарчук - докторка філологічних наук; Оксана Зубань - кандидатка філологічних наук; Валентина Робейко - асистентка.

Коротко. Під час заходу будуть обговорені проблеми комп’ютерного аналізу тексту з метою визначення авторства анонімних українськомовних текстів, виявлення токсичного контенту в соціальних мережах та автоматичного укладання лінгвістичної експертизи тексту.

Також відбудеться демонстрація роботи вебзастосунку TextAttributor 1.0 для встановлення імовірного авторства анонімних текстів і виявлення рівня токсичності контенту.

Довідково. Проєкт реалізовано Українським лінгвістичним центром спільно з Інститутом філології КНУ імені Тараса Шевченка за підтримки посольства Великої Британії та Північної Ірландії.

Формат заходу – офлайн (Зала 2) + онлайн-включення.

Журналісти зможуть поставити питання офлайн (Зала 2).

Прохання до журналістів прибувати за пів години до заходу.

Акредитація представників ЗМІ: anna@ukrinform.com.

Контактна особа: Костянтин Гончаренко +38 050 942 4606

Захід транслюватиметься на сайті та YouTube-каналі Укрінформу: https://www.youtube.com/@UkrinformTV.

Адреса Укрінформу: м. Київ, вул. Богдана Хмельницького, 8/16.

Використання будь-яких матеріалів з офіційного YouTube-каналу Укрінформ можливе лише за умови дотримання авторських прав, встановлених каналом. Під час демонстрації ролика в ході прямого ефіру необхідно послатися на автора — Укрінформ — показати його назву на екрані та вимовити її вголос.

Читайте Пресцентр Укрінформу в Telegram.

Підсумкові матеріали:

В Укрінформі презентували проєкт щодо визначення авторства анонімних українськомовних текстів у інтернеті

Український науковий центр лінгвістичних студій представив проєкт із визначення авторства анонімних українськомовних текстів в інтернеті.

Презентація проєкту відбулася в Укрінформі.

"В результаті нашої роботи ми отримали застосунок TextAttributor 1.0 , який здатний виконувати низку завдань: автоматичний лінгвістичний аналіз тексту, атрибуцію україномовного тексту, стилеметрію авторських текстів, визначення токсичності україномовного тексту, визначення мови ворожнечі в соціальних мережах, автоматичну генерацію експертного висновку атрибуції тексту", - розповіла на презентації кандидат філологічних наук Оксана Зубань.

Вона зазначила, що метою проєкту було створення системи параметризації медійного українськомовного тексту, яка послужить інструментом лінгвістичного аналізу в завданнях з телеметрії, визначення авторства і визначення токсичності тексту.

Як додала Зубань, застосунок аналізує будь-який текст за 18 параметрами, серед яких базовими є такі, як кількість слів, кількість речень, обсяг словника. Інші 15 параметрів обчислюються за певними формулами. Одним із таких параметрів є індекс токсичності тексту, який вираховується за формулою і враховує вербальні ознаки, які систематизовані в окремі бази даних.

У базі даних застосунку є лексикографічний словник обсягом 5 тис. слів, до якого увійшли слова з негативною тональністю, словник мови ворожнечі обсягом 3 тис. слів, до якого увійшли негативні назви людей, обсценна та лайлива лексика, словник токсичних сполук обсягом 1,5 тис. синтагм, які виражають негативний сенс лише в певному словосполученні.

Під час презентації проєкту науковці продемонстрували роботу вебзастосунку TextAttributor 1.0 для встановлення імовірного авторства анонімних текстів і виявлення рівня токсичності контенту.

Проєкт реалізовано Українським лінгвістичним центром спільно з Інститутом філології КНУ імені Тараса Шевченка за підтримки посольства Великої Британії та Північної Ірландії.

Відео:

Замовити фото натисніть тут - Фотобанк