1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による Supervised Learning:回帰

Connected

演習

カテゴリ変数の構造を確認する

この演習では、model.matrix()(ドキュメント)を呼び出して、R がカテゴリ入力と数値入力を併せ持つデータをモデリング用にどのように表現するかを確認します。Sleuth3 パッケージ由来のデータセット flowers が読み込まれています。次の列を含みます。

  • Flowers: meadowfoam 植物の平均開花数
  • Intensity: 植物に与えた光処理の強度
  • Time: カテゴリ変数。光処理がライフサイクルのどの時期(Late または Early)に行われたか

最終的な目標は、Flowers を Time と Intensity の関数として予測することです。

指示

100 XP
  • flowers に対して str() 関数を呼び出し、各列の型を確認します。
  • 列 flowers$Time に対して unique() 関数を使い、Time が取りうる値を確認します。ユニークな値はいくつありますか?
  • Flowers を Intensity と Time の関数として表す式を作成し、変数 fmla に代入して表示します。
  • fmla と model.matrix() を使って、データフレーム flowers のモデル行列を作成し、変数 mmat に代入します。
  • head() を使って、flowers の先頭20行を確認します。
  • 次に、mmat の先頭20行を確認します。
    • 数値列の Intensity は変わっていますか?
    • flowers のカテゴリ列 Time はどう変換されましたか?
    • Time == 'Early' はどのように表現されていますか?Time == 'Late' は?