1. 学ぶ
  2. /
  3. コース
  4. /
  5. R で学ぶクレジットリスク・モデリング

Connected

演習

ヒストグラム

データセット loan_data はワークスペースに読み込まれています。前の演習では、CrossTable() 関数を使ってカテゴリ変数を探索しました。今回は、連続変数を調べて、外れ値や想定外のデータ構造がないかを確認したいと考えています。

そのために、hist() 関数を使って、顧客ごとのローン件数の分布を把握してみましょう。

指示

100 XP
  • hist() を使って、引数を1つだけ指定し、loan_data$loan_amnt のヒストグラムを作成します。結果を hist_1 という新しいオブジェクトに代入してください。
  • ヒストグラムの階級(ビン)の情報を得るために、オブジェクト hist_1 と $breaks を組み合わせて確認します。ビンの位置は重要で、選び方が悪いとヒストグラムは誤解を招く可能性があります。
  • hist_1 のビン数を breaks 引数で 200 に変更します。さらに、xlab 引数で x 軸に "Loan amount"、main 引数でタイトルを "Histogram of the loan amount" と付けます。結果を hist_2 に保存してください。なぜピークはその位置に現れるのでしょうか?