Методологічні проблеми виявлення викидів у метрології з використанням моделей машинного навчання

Автор(и)

  • Валерій Ащепков Національний науковий центр “Інститут метрології”, вул. Мироносицька, 42, 61002, Харків, Україна, Україна
  • Дмитро Бяллович Національний науковий центр “Інститут метрології”, вул. Мироносицька, 42, 61002, Харків, Україна, Україна
  • Володимир Скляров Національний науковий центр “Інститут метрології”, вул. Мироносицька, 42, 61002, Харків, Україна, Україна

DOI:

https://doi.org/10.24027/2306-7039.3.2025.340615

Ключові слова:

метрологія; стандартна невизначеність; машинне навчання; викиди; аномалії; обробка результатів вимірювань

Анотація

У статті розглядаються проблеми, пов’язані із застосуванням моделей машинного навчання для виявлення викидів у метрологічних вибірках. Попри здатність таких моделей ідентифікувати складні відхилення у структурі вибірки без необхідності попередніх статистичних припущень, вони не забезпечують нормативно обґрунтованих критеріїв оцінки достовірності прийнятих рішень. Зокрема, відсутні інтерпретовані показники довіри, метрологічна простежуваність і формалізовані порогові значення, які б дозволяли однозначно визначити, чи є те чи інше значення справжнім викидом. Одним із запропонованих рішень є оцінка впливу виключення аномальних значень, виявлених за допомогою моделі Isolation Forest, на стандартну невизначеність типу А за умови збереження початкового обсягу вибірки шляхом повторних вимірювань. Такий підхід було апробовано на основі реальних результатів вимірювань витрати рідини з використанням коріолісових витратомірів різних діаметрів. Отримані результати підтвердили ефективність підходу в тих випадках, коли видалення значень, що спотворювали результат, призводило до суттєвого зменшення варіативності вимірювань. Водночас було виявлено низку обмежень, зокрема чутливість моделі до малих вибірок, практичну неможливість проведення повторних вимірювань у багатьох реальних ситуаціях і відсутність об’єктивного критерію, який би визначав “суттєвість” зменшення невизначеності. Зазначені результати підкреслюють необхідність подальших досліджень щодо формалізації критеріїв довіри при виявленні аномалій у метрології, особливо в контексті відповідності міжнародним стандартам, таким як ISO/IEC 17025.

Попри зазначені обмеження, застосування моделей машинного навчання відкриває нові можливості для автоматизації аналізу метрологічних даних і вказує на потребу у створенні узгоджених підходів до інтеграції таких рішень у нормативне середовище.

Посилання

DSTU GOST ISO 5725-1:2005. Accuracy (trueness and precision) of measurement methods and results. Part 1. General principles and definitions (GOST ISO 5725-1-2003, IDT) (in Ukrainian).

Ashchepkov V., Byallovych D., Skliarov V. Vplyv porogovykh znachen na standartnu nevyznachenist typu A pry vymiryuvannyakh masovoyi vytraty ridyny [The influence of threshold values on Type A standard uncertainty in mass flow rate measurements for liquids]. Ukrainian Metrological Journal, 2024, no. 3 (in Ukrainian). doi: https://doi.org/10.24027/2306-7039.3.2024.312469

Chandola V., Banerjee A., Kumar V. Anomaly detection: A survey. ACM Computing Surveys, 2009, vol. 41, issue 3, pp. 1–58. doi: https://doi.org/10.1145/1541880.1541882

Aggarwal C.C. Outlier Analysis. 2nd ed. Springer, 2017. 446 p. doi: https://doi.org/10.1007/978-3-319-47578-3

Breunig M.M., Kriegel H.-P., Ng R.T., Sander J. LOF: Identifying density-based local outliers. ACM SIGMOD Record, 2000, vol. 29, issue 2, pp. 93–104. doi: https://doi.org/10.1145/335191.335388

Schölkopf B., Platt J., Shawe-Taylor J., Smola A.J., Williamson R.C. Estimating the Support of a High-Dimensional Distribution. Neural Computation, 2001, no 13 (7), pp. 1443–1471. doi: https://doi.org/10.1162/089976601750264965

Ruff L., Vandermeulen R.A., Görnitz N., Deecke L. et al. Deep One-Class Classification. Proceedings of the 35th International Conference on Machine Learning (ICML), 2018, vol. 80, pp. 4393–4402.

Liu F.T., Ting K.M., Zhou Z.-H. Isolation Forest. Proceedings of the IEEE International Conference on Data Mining (ICDM), 2008, pp. 413–422. doi: https://doi.org/10.1109/ICDM.2008.17

Hinton G.E., Salakhutdinov R.R. Reducing the Dimensionality of Data with Neural Networks. Science, 2006, vol. 313, no. 5786, pp. 504–507. doi: https://doi.org/10.1126/science.1127647

Ahmed M., Mahmood A.N., Hu J. A survey of network anomaly detection techniques. Journal of Network and Computer Applications, 2016, vol. 60, pp. 19–31. doi: https://doi.org/10.1016/j.jnca.2015.11.016

DSTU EN ISO/IEC 17025:2019. General requirements for the competence of testing and calibration laboratories (EN ISO/IEC 17025:2017, IDT; ISO/IEC 17025:2017, IDT) (in Ukrainian).

Ashchepkov V.O. Vykorystannya modeli Isolation Forest dlya vyyavlennya anomaliy u danykh vymiryuvan [The use of the Isolation Forest model for anomaly detection in measurement data]. Innovative technologies and scientific solutions for industries, 2024, no. 1(27), pp. 98–113 (in Ukrainian). doi: https://doi.org/10.30837/ITSSI.2024.27.236

Опубліковано

2025-09-30 — Оновлено 2025-10-03

Версії

Номер

Розділ

Статті