1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ探索的データ分析

Connected

Exercise

クラス不均衡を確認する

2022 Kaggle Survey では、データサイエンティストの経歴、好むテクノロジーや手法に関する情報が収集されています。回答数と回答者のプロフィールから、データサイエンス分野の動向を正確に反映していると見なされています。

職種名を確認し、salaries データフレームに合わせてカテゴリ化したところ、Kaggle の調査における職種カテゴリの比率は次のとおりです。

Job Category Relative Frequency
Data Science 0.281236
Data Analytics 0.224231
Other 0.214609
Managerial 0.121300
Machine Learning 0.083248
Data Engineering 0.075375

Kaggle の調査結果を母集団とみなして、salaries データフレームの職種カテゴリの相対度数を比較し、代表性があるかどうかを確認してください。

Instructions

100 XP
  • salaries データフレームの "Job_Category" 列について、相対度数を出力してください。