Український науковець розробив датасет для прогнозування поширення коронавірусу
Про це завідувач кафедри системного аналізу та інформаційних технологій, доктор технічних наук, професор, науковий керівник науково-дослідної лабораторії екологічних досліджень та екологічного моніторингу Вінницького національного технічного університету Віталій Мокін розповів у інтерв’ю Укрінформу.
«Я тривалий час займаюся так званим напрямком Data Science. Це те, що зараз ще часто називають «штучний інтелект», хоча це дещо різні поняття. Я зосередився на збільшенні рейтингу в опануванні штучного інтелекту на Python (мова програмування – ред.) у системі Kaggle – це платформа Google для обробки даних у різних сферах. У квітні стартував челендж для датасайнтистів. Це була система конкурсів із моделювання поширення коронавірусу. Я також долучився. Влітку серйозно зайнявся цим питанням і побудував власну модель на основі технології Фейсбуку для моделювання часових рядів, – так звана модель Prophet (з англійської – «Пророк»). Я дещо там вдосконалив, і моя модель, мій датасет, моя технологія аналогів не мали. Зараз я вже розробив нову модель, яка моделює увесь ряд даних, зокрема, в основних 70 країнах світу. Вона дає досить непогані результати прогнозування. Вона складніша, я її зараз удосконалюю і готую оновлення. За нею ми вже будемо «програвати» сценарії – між оптимістичним і песимістичним, щоб прогнозування можна було зробити більш довгостроковим», - сказав Мокін.
За його словами, діюча наразі модель опрацьовує дані з 70 країн і дозволяє робити тижневі та двотижневі прогнози поширення епідемії коронавірусу. Їх включають до щотижневого звіту міжвідомчої робочої групи при Національній академії наук України (НАНУ) з прогнозування поширення коронавірусу, створеній для потреб РНБО і Кабміну.
«Академія наук використовує так звану компартментну модель. По суті, це – балансова динамічна модель, яка бере за основу різні складові, що характеризують природу явища, й описує, як вони між собою взаємодіють. Я ж використовую статистичну модель – модель часового ряду. Працюю зі своїм аспірантом Арсеном Лосенком. Ми даємо загальний графік по країні. Беремо один показник, ряд його чисел за рік і прогнозуємо наступні значення», - сказав науковець.
Він пояснив, що працює із офіційними даними про випадки коронавірусу, підтверджені ПЛР-тестуванням. На їх основі модель, яка нівелює «аномалії» офіційної статистики, робить прогноз кількості нових хворих.
Модель Мокіна із прогнозування поширення коронавірусу працює з показниками, починаючи з моменту різкого збільшення захворюваності, – з 6 липня. Наразі вона забезпечує точність прогнозів із похибкою 2-7,5%.
Як повідомляв Укрінформ, в Україні за минулу добу, 4 січня, зареєстрували 5 334 нові випадки захворювання на COVID-19. За весь час пандемії в країні захворіло на COVID-19 1 083 585 осіб, одужало 747 408 осіб; 19 129 людей померло.