У межах створення Нацкорпусу кримськотатарської мови опрацьовано понад 700 матеріалів
Про це повідомляє пресслужба Мінреінтеграції, передає Укрінформ.
"Збір друкованих та електронних текстів кримськотатарською мовою для їх подальшого імпорту на платформу Sketch Engine розпочався з жовтня 2022 року. За майже пів року були опрацьовані та внесені до каталогу понад 700 матеріалів. Серед них – твори кримськотатарських авторів, журнали, газети, підручники, документи міжнародних організацій, субтитри фільмів тощо», - йдеться у повідомленні.
Зазначається, що за цей час також розроблено словник лематизації - ідеться про створення реєстру (бази даних) слів з позначенням їх початкової форми та мовних характеристик, що потрібно для запуску модуля з пошуку слів на онлайн-платформі.
Розробка відповідного програмного забезпечення триває.
Як повідомлялося, Мінреінтеграції ініціювало створення Національного корпусу кримськотатарської мови (НККМ) у межах реалізації Стратегії розвитку кримськотатарської мови на 2022-2032 роки. НККМ – це онлайн-платформа для дослідження мови, що працюватиме на даних із текстових матеріалів кримськотатарською.
Поєкт реалізується за підтримки швейцарсько-української Програми EGAP, що виконується Фондом Східна Європа, та Київського національного університету імені Тараса Шевченка.