Методологічні проблеми виявлення викидів у метрології з використанням моделей машинного навчання

Валерій Ащепков; Дмитро Бяллович; Володимир  Скляров

doi:10.24027/2306-7039.3.2025.340615

Автор(и)

Валерій Ащепков Національний науковий центр “Інститут метрології”, вул. Мироносицька, 42, 61002, Харків, Україна, Україна
Дмитро Бяллович Національний науковий центр “Інститут метрології”, вул. Мироносицька, 42, 61002, Харків, Україна, Україна
Володимир Скляров Національний науковий центр “Інститут метрології”, вул. Мироносицька, 42, 61002, Харків, Україна, Україна

DOI:

https://doi.org/10.24027/2306-7039.3.2025.340615

Ключові слова:

метрологія; стандартна невизначеність; машинне навчання; викиди; аномалії; обробка результатів вимірювань

Анотація

У статті розглядаються проблеми, пов’язані із застосуванням моделей машинного навчання для виявлення викидів у метрологічних вибірках. Попри здатність таких моделей ідентифікувати складні відхилення у структурі вибірки без необхідності попередніх статистичних припущень, вони не забезпечують нормативно обґрунтованих критеріїв оцінки достовірності прийнятих рішень. Зокрема, відсутні інтерпретовані показники довіри, метрологічна простежуваність і формалізовані порогові значення, які б дозволяли однозначно визначити, чи є те чи інше значення справжнім викидом. Одним із запропонованих рішень є оцінка впливу виключення аномальних значень, виявлених за допомогою моделі Isolation Forest, на стандартну невизначеність типу А за умови збереження початкового обсягу вибірки шляхом повторних вимірювань. Такий підхід було апробовано на основі реальних результатів вимірювань витрати рідини з використанням коріолісових витратомірів різних діаметрів. Отримані результати підтвердили ефективність підходу в тих випадках, коли видалення значень, що спотворювали результат, призводило до суттєвого зменшення варіативності вимірювань. Водночас було виявлено низку обмежень, зокрема чутливість моделі до малих вибірок, практичну неможливість проведення повторних вимірювань у багатьох реальних ситуаціях і відсутність об’єктивного критерію, який би визначав “суттєвість” зменшення невизначеності. Зазначені результати підкреслюють необхідність подальших досліджень щодо формалізації критеріїв довіри при виявленні аномалій у метрології, особливо в контексті відповідності міжнародним стандартам, таким як ISO/IEC 17025.

Попри зазначені обмеження, застосування моделей машинного навчання відкриває нові можливості для автоматизації аналізу метрологічних даних і вказує на потребу у створенні узгоджених підходів до інтеграції таких рішень у нормативне середовище.

Посилання

DSTU GOST ISO 5725-1:2005. Accuracy (trueness and precision) of measurement methods and results. Part 1. General principles and definitions (GOST ISO 5725-1-2003, IDT) (in Ukrainian).

Ashchepkov V., Byallovych D., Skliarov V. Vplyv porogovykh znachen na standartnu nevyznachenist typu A pry vymiryuvannyakh masovoyi vytraty ridyny [The influence of threshold values on Type A standard uncertainty in mass flow rate measurements for liquids]. Ukrainian Metrological Journal, 2024, no. 3 (in Ukrainian). doi: https://doi.org/10.24027/2306-7039.3.2024.312469

Chandola V., Banerjee A., Kumar V. Anomaly detection: A survey. ACM Computing Surveys, 2009, vol. 41, issue 3, pp. 1–58. doi: https://doi.org/10.1145/1541880.1541882

Aggarwal C.C. Outlier Analysis. 2nd ed. Springer, 2017. 446 p. doi: https://doi.org/10.1007/978-3-319-47578-3

Breunig M.M., Kriegel H.-P., Ng R.T., Sander J. LOF: Identifying density-based local outliers. ACM SIGMOD Record, 2000, vol. 29, issue 2, pp. 93–104. doi: https://doi.org/10.1145/335191.335388

Schölkopf B., Platt J., Shawe-Taylor J., Smola A.J., Williamson R.C. Estimating the Support of a High-Dimensional Distribution. Neural Computation, 2001, no 13 (7), pp. 1443–1471. doi: https://doi.org/10.1162/089976601750264965

Ruff L., Vandermeulen R.A., Görnitz N., Deecke L. et al. Deep One-Class Classification. Proceedings of the 35th International Conference on Machine Learning (ICML), 2018, vol. 80, pp. 4393–4402.

Liu F.T., Ting K.M., Zhou Z.-H. Isolation Forest. Proceedings of the IEEE International Conference on Data Mining (ICDM), 2008, pp. 413–422. doi: https://doi.org/10.1109/ICDM.2008.17

Hinton G.E., Salakhutdinov R.R. Reducing the Dimensionality of Data with Neural Networks. Science, 2006, vol. 313, no. 5786, pp. 504–507. doi: https://doi.org/10.1126/science.1127647

Ahmed M., Mahmood A.N., Hu J. A survey of network anomaly detection techniques. Journal of Network and Computer Applications, 2016, vol. 60, pp. 19–31. doi: https://doi.org/10.1016/j.jnca.2015.11.016

DSTU EN ISO/IEC 17025:2019. General requirements for the competence of testing and calibration laboratories (EN ISO/IEC 17025:2017, IDT; ISO/IEC 17025:2017, IDT) (in Ukrainian).

Ashchepkov V.O. Vykorystannya modeli Isolation Forest dlya vyyavlennya anomaliy u danykh vymiryuvan [The use of the Isolation Forest model for anomaly detection in measurement data]. Innovative technologies and scientific solutions for industries, 2024, no. 1(27), pp. 98–113 (in Ukrainian). doi: https://doi.org/10.30837/ITSSI.2024.27.236

Методологічні проблеми виявлення викидів у метрології з використанням моделей машинного навчання

Автор(и)

DOI:

Ключові слова:

Анотація

Посилання

##submission.downloads##

Опубліковано

Версії

Номер

Розділ

Ліцензія

##plugins.block.developedBy.blockTitle##

Мова