1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶクレジットリスク・モデリング

Connected

演習

欠損データの削除

データセット loan_data では、これまでに見たとおり、金利(int_rate)は顧客によって異なります。残念ながら、一部の観測には金利が欠損しています。まず欠損している金利がいくつあるかを特定し、その後に削除しましょう。

この演習では、which() 関数を使って NA を含む行のインデックスを作成します。続いて、このインデックスを使って NA のある行を削除します。

指示

100 XP
  • 変数 int_rate について、欠損入力の数を summary() で確認します。
  • which() と is.na() を使って、金利が記録されていない観測のインデックスを作成し、オブジェクト na_index に保存します。
  • 金利が欠損している観測を含まない新しいデータセット loan_data_delrow_na を作成します。
  • loan_data のコピーである loan_data_delcol_na を作成したことを思い出してください。金利が欠損している観測を削除する代わりに、int_rate 列全体を NULL に設定して列ごと削除します。