分布内の値を強調表示する

より良い可視化のためにデータを前処理する必要があることがあります。欠損値の処理には .dropna() と .fillna() という2つの方法があります。また、特定の列に対して .quantile() を使って条件を適用し、あるパーセンタイルを超える（または下回る）外れ値をフィルタリングして除外できます。

動画では、特定の値を強調するために、軸全体に位置 x の垂直線を追加する方法も見ました。

Axes.axvline(x=0, color=None, ...)

この演習では、世界の所得分布を最後にもう一度確認し、95パーセンタイルを超える外れ値を除外して分布をプロットし、平均値と中央値の両方を強調表示します。pandas は pd、seaborn は sns、matplotlib.pyplot は plt としてインポート済みで、前の演習で使った income DataFrame はワークスペースで利用できます。

列 'Income per Capita' を inc_per_capita に代入します。
inc_per_capita のうち、95パーセンタイルより小さい行だけにフィルタし、同じ変数に代入し直します。
フィルタ後の inc_per_capita について、デフォルト設定のヒストグラムをプロットし、ax に代入します。
ax.axvline() を color='b' として使い、inc_per_capita の平均を青で強調表示します。
ax.axvline() を color='g' として使い、中央値を緑で強調表示します。結果を表示しましょう！

Exercise

分布内の値を強調表示する

Instructions

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Exercise

Instructions

Exercise