1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu khám phá trong Python

Connected

Bài tập

Kiểm tra sự mất cân bằng giữa các lớp

Khảo sát Kaggle 2022 thu thập thông tin về nền tảng, công nghệ và kỹ thuật ưa thích của các nhà khoa học dữ liệu. Nhờ số lượng và hồ sơ người trả lời, khảo sát này được xem là phản ánh khá chính xác những gì đang diễn ra trong lĩnh vực khoa học dữ liệu.

Sau khi xem các chức danh công việc và phân loại để khớp với DataFrame salaries, bạn có thể thấy tỷ lệ của các nhóm công việc trong khảo sát Kaggle như sau:

Job Category Relative Frequency
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

Xem kết quả khảo sát Kaggle như một quần thể, nhiệm vụ của bạn là kiểm tra liệu DataFrame salaries có đại diện hay không bằng cách so sánh tần suất tương đối của các nhóm công việc.

Hướng dẫn

100 XP
  • In ra tần suất tương đối của cột "Job_Category" từ DataFrame salaries.