Остання редакція: 2025-06-13
Анотація
Дослідження присвячене підготовці та розвідувальному аналізу даних для подальшого використання в інформаційній технології аналізу та передбачення заробітної плати Data Developers методами машинного навчання. Проведено аналіз структури датасету та його основних характеристик, а також досліджено можливі взаємозв’язки між рівнем оплати праці Data Developers та таких ключових чинників як професійний досвід, формат зайнятості, можливість віддаленої роботи та масштаб компанії.
EXPLORATORY DATA ANALYSIS FOR INFORMATION TECHNOLOGY OF ANALYSIS AND PREDICTION OF SALARY DATA DEVELOPERS USING MACHINE LEARNING METHODS
Abstract:
The study is devoted to the preparation and exploratory data analysis for further use in the information technology of analysis and prediction of Data Developers' salaries using machine learning methods. The dataset structure and its key features were analyzed, as well as investigates possible relationships between the level of remuneration of Data Developers and such key factors as professional experience, employment format, the possibility of remote work and the scale of the company.
Ключові слова
Посилання
Ghorai, P., Barik, R. Salary Prediction Using Machine Learning Techniques. In: Tiwari, S., Trivedi, M.C., Kolhe, M.L., Singh, B.K. (eds) Advances in Data and Information Sciences. ICDIS 2024. Lecture Notes in Networks and Systems, 2025, vol 1193. Springer, Singapore. https://doi.org/10.1007/978-981-97-9619-9_17
Rukiye Kaya, Mehtap Saatçi, Mehmet Gökhan Bakal. "Improving Salary Offer Processes With Classification Based Machine Learning Models", 2024 8th International Artificial Intelligence and Data Processing Symposium (IDAP), 2024, pp.1-7, doi: 10.1109/IDAP64064.2024.10710706
A. Asaduzzaman, M. R. Uddin, Y. Woldeyes and F. N. Sibai, "A Novel Salary Prediction System Using Machine Learning Techniques," 2024 Joint International Conference on Digital Arts, Media and Technology with ECTI Northern Section Conference on Electrical, Electronics, Computer and Telecommunications Engineering (ECTI DAMT & NCON), Chiang-mai, Thailand, 2024, pp. 38-43, doi: 10.1109/ECTIDAMTNCON60518.2024.10480058
Data Developer Salary in 2024 [Електронний ресурс]. – Режим доступу: https://www.kaggle.com/datasets/zeesolver/data-eng-salary-2024
Міжквартильний або інтерквартильний розмах (IQR) [Електронний ресурс]. – Режим доступу: https://uk.economy-pedia.com/11035383-interquartile-range
Pandas Getting started. 2024 [Електронний ресурс] – Режим доступу: https://pandas.pydata.org/docs/getting_started/index.html
Seaborn Tutorial. 2023 [Електронний ресурс]. – Режим доступу: https://seaborn.pydata.org/tutorial.html
Matplotlib Pyplot Documentation. 2024 [Електронний ресурс]. – Режим доступу: https://matplotlib.org/3.5.3/api/_as_gen/matplotlib.pyplot.html
Мокін В.Б., Дратований М.В. Наука про дані: машинне навчання та інтелектуальний аналіз даних. Навчальний посібник. м. Вінниця, 2024 р. 263 с. URL: https://iq.vntu.edu.ua/repository/getfile.php/8163.pdf
A Complete Guide to Data Visualization in Python With Libraries & More. 2023 [Електронний ресурс]. – Режим доступу: https://www.simplilearn.com/tutorials/python-tutorial/data-visualization-in-python