1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

不完全なデータによる線形回帰

欠損データはよく見られる問題であり、適切に対処することが非常に重要です。欠損データを無視したり、誤った値で補完したりすると、モデルが予期しない動作をし、予測や推論にバイアスが生じる可能性があります。

この章では、biopics データセットを使って学習を進めます。このデータセットには、収益、伝記の対象者の特徴など、複数の伝記映画に関する情報が含まれています。ただし、一部のデータは欠損しています。元のデータは R パッケージ fivethirtyeight に含まれていますが、このコースでは、前処理済みのバージョンを使用します。

この演習では、データセットの内容を把握したうえで、映画の収益を説明する線形回帰モデルを構築します。さっそく始めましょう!

指示1 / 4

undefined XP
    1
    2
    3
    4
  • biopics データの最初の10件を表示して、各変数の内容を確認しましょう。