1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで統計面接問題を練習しよう

Connected

연습 문제

外れ値への感度

複数の変数の関係を分析するとき、相関はとても良い出発点です。ただし、より興味深いデータセットに対して相関はどこまで有効でしょうか。特に外れ値に対してどれくらい頑健でしょうか?

この演習では、外れ値を含むデータセットで散布図を作成し、相関を計算します。次に外れ値を取り除いて、何が変わるかを確かめます。最終的には、相関がどのように振る舞うかを観察し、いつ・どのような場面で相関を使うべきかについて結論を出します。

有名なアンスコムの四分位からのサンプルデータセットが、変数dfとして読み込まれています。この章で使用したすべてのパッケージも利用できます。

지침 1/3

undefined XP
    1
    2
    3
  • XとYの特徴量について、matplotlibで散布図を表示し、右上にある外れ値に注目してください。