1. 학습
  2. /
  3. 프로젝트
  4. /
  5. Pythonで学ぶ米国センサスデータ分析

Connected

연습 문제

極端な値を特定する

州別のヒスパニック系の人々による人種自己申告の割合をまとめたDataFrameを作成できたので、まずは seaborn を使って箱ひげ図を作成し、さらに詳しく探索していきます。

また、特定の人種として自己申告するヒスパニック系の割合が最も大きい(または小さい)州も見つけます。そのために squeeze() メソッドを使います。このメソッドは1行だけのDataFrameをSeriesに変換します(複数行のDataFrameには影響しません)。

pandas はインポート済みです。7つの人種区分ごとの自己申告割合を含むDataFrame states_hr が読み込まれています。

지침

100 XP
  • data 引数にDataFrame名を指定して箱ひげ図を作成します。(orient = "h" とすると、箱ひげ図が横向き=horizontal に描画されます。)
  • squeeze を使って、列 hispanic_white で最大値の州名を表示します。
  • squeeze を使って、列 hispanic_other で最小値の州名を表示します。
  • アジア系として自己申告するヒスパニック系は非常に少ないものの、1つの州だけ大きな外れ値になっています。squeeze を使って、列 hispanic_asian で最大値の州名を表示します。