КОНФЕРЕНЦІЇ ВНТУ електронні наукові видання, 
Молодь в науці: дослідження, проблеми, перспективи (МН-2026)

Розмір шрифта: 
ПОРІВНЯЛЬНИЙ АНАЛІЗ ВІДКРИТИХ АНОТОВАНИХ ДАТАСЕТІВ ДЛЯ РОЗРОБКИ СИСТЕМ АВТОМАТИЗОВАНОГО АНАЛІЗУ ЦИТОЛОГІЧНИХ ЗОБРАЖЕНЬ
Владислав Олександрович Лещенко

Остання редакція: 2026-06-23

Анотація


У роботі здійснено порівняльний аналіз відкритих анотованих датасетів цитологічних зображень, які використовуються при розробці систем автоматизованої діагностики онкопатологій. Систематизовано обмеження наявних публічних ресурсів та наведено кількісні докази деградації моделей через доменний зсув. Обґрунтовано доцільність формування власної мультицентрової бази даних, репрезентативної для українського клінічного контексту.

 


COMPARATIVE ANALYSIS OF OPEN ANNOTATED DATASETS FOR THE DEVELOPMENT OF AUTOMATED CYTOLOGICAL IMAGE ANALYSIS SYSTEMS

Abstract:

The paper presents a comparative analysis of publicly available annotated cytological image datasets used for developing automated diagnostic systems for oncopathologies. The limitations of existing public resources are systematized and quantitative evidence of model performance degradation due to domain shift is provided. The expediency of forming a proprietary multicentre dataset representative of the Ukrainian clinical context is substantiated.

 


Ключові слова


цитологічні зображення; анотовані датасети; доменний зсув; інстансна сегментація; CAD-системи; рак шийки матки; cytological images; annotated datasets; domain shift; instance segmentation; CAD systems; cervical cancer

Посилання


1. Бюлетень Національного канцер-реєстру України № 26. Рак в Україні, 2023–2024 / уклад. З. П. Федоренко та ін. К. : НКРУ, 2025. URL: http://www.ncru.inf.ua/publications/BULL_26/index.htm (дата звернення: 06.05.2026).

 

2. Volodko N., Chopyak V., Mazur Yu. Barriers to implementing cervical cancer screening in Ukraine: the path forward. Proceedings of the Shevchenko Scientific Society. Medical Sciences. 2025. Vol. 77, № 1. DOI: 10.25040/ntsh2025.01.01.

 

3. Jantzen J., Norup J., Dounias G., Bjerregaard B. Pap-smear Benchmark Data for Pattern Classification. Proc. NiSIS 2005. Albufeira : NiSIS, 2005. P. 1–9.

 

4. Plissiti M. E. et al. SIPaKMeD: A new dataset for feature and image based classification of normal and pathological cervical cells in Pap smear images. 2018 IEEE ICIP. 2018. P. 3144–3148. DOI: 10.1109/ICIP.2018.8451588.

 

5. Hussain E., Mahanta L. B., Borah H., Das C. R. Liquid based-cytology Pap smear dataset for automated multi-class diagnosis of pre-cancerous and cervical cancer lesions. Data in Brief. 2020. Vol. 30. Art. 105589. DOI: 10.1016/j.dib.2020.105589.

 

6. Rezende M. T. et al. CRIC searchable image database as a public platform for conventional Pap smear cytology data. Scientific Data. 2021. Vol. 8. Art. 151. DOI: 10.1038/s41597-021-00933-8.

 

7. Lu Z., Carneiro G., Bradley A. P. et al. Evaluation of three algorithms for the segmentation of overlapping cervical cells. IEEE J. Biomed. Health Inform. 2017. Vol. 21, № 2. P. 441–450. DOI: 10.1109/JBHI.2016.2519686.

 

8. Liu J. et al. Local Label Point Correction for Edge Detection of Overlapping Cervical Cells. Frontiers in Neuroinformatics. 2022. Vol. 16. Art. 895290. DOI: 10.3389/fninf.2022.895290.

 

9. Liu G. et al. Cx22: A new publicly available dataset for deep learning-based segmentation of cervical cytology images. Computers in Biology and Medicine. 2022. Vol. 150. Art. 106194. DOI: 10.1016/j.compbiomed.2022.106194.

 

10. Zhao J. et al. CNSeg: A dataset for cervical nuclear segmentation. Computer Methods and Programs in Biomedicine. 2023. Vol. 241. Art. 107732. DOI: 10.1016/j.cmpb.2023.107732.

 

11. Campbell M. J. et al. BMT: A Cross-Validated ThinPrep Pap Cervical Cytology Dataset for Machine Learning Model Training and Validation. Scientific Data. 2024. DOI: 10.1038/s41597-024-04328-3.

 

12. Zhang X. et al. A large annotated cervical cytology images dataset for AI models to aid cervical cancer screening. Scientific Data. 2025. Vol. 12. Art. 23. DOI: 10.1038/s41597-025-04374-5.

 

13. Perez Bianchi P. et al. RIVA: An Image Dataset of Conventional Pap Smear Cytology with Multiple Independent Annotations. Scientific Data. 2025. DOI: 10.1038/s41597-025-06280-2.

 

14. Mosquera-Zamudio A. et al. Deep-learning approaches for cervical cytology nuclei segmentation in whole slide images. Journal of Imaging. 2025. Vol. 11, № 5. Art. 137. DOI: 10.3390/jimaging11050137.

 

15. Ocampo-López-Escalera J. et al. Robust Cell-Level Classification for Liquid-Based Cervical Cytology Using Deep Transfer Learning: A Multi-Source Study Addressing Scanner-Induced Domain Shifts. Bioengineering. 2026. Vol. 13. Art. 289. DOI: 10.3390/bioengineering13030289.

 

16. Nayar R., Wilbur D. C. The Bethesda System for Reporting Cervical Cytology: Definitions, Criteria, and Explanatory Notes. 3rd ed. Cham : Springer, 2015. DOI: 10.1007/978-3-319-11074-5.

 

17. Про затвердження Технічного регламенту щодо медичних виробів : Постанова Кабінету Міністрів України від 02.10.2013 № 753. URL: https://zakon.rada.gov.ua/laws/show/753-2013-п (дата звернення: 06.05.2026).

 

18. U. S. Food and Drug Administration. Artificial Intelligence/Machine Learning (AI/ML)-Based Software as a Medical Device (SaMD) Action Plan. Silver Spring, MD : FDA, 2021. URL: https://www.fda.gov/medical-devices/software-medical-device-samd/artificial-intelligence-software-medical-device (дата звернення: 06.05.2026).


Повний текст: PDF