1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的探索性数据分析

Connected

道练习

检查类别不平衡

2022 Kaggle Survey 收集了关于数据科学家的背景、偏好的技术与方法等信息。基于受访者的数量与画像,它被视为能够准确反映数据科学领域现状的调查。

在查看了职位名称并将其归类以与我们的 salaries 数据框对齐后,您可以看到 Kaggle 调查中各职位类别的占比如下:

Job Category Relative Frequency
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

将 Kaggle 调查结果视为总体,您的任务是通过比较职位类别的相对频率,判断 salaries 数据框是否具有代表性。

说明

100 XP
  • 打印 salaries 数据框中 "Job_Category" 列的相对频率。