1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶマーケティングアナリティクスのための機械学習

Connected

演習

データを見てみましょう

ワークスペースにはデータセットsalesDataが読み込まれています。これは、1~3か月目の顧客情報を含み、4か月目は売上のみが含まれます。意味が分かりにくい変数については、次の表で説明します。

Variable Description
id 顧客の識別番号
mostFreqStore 最もよく購入した店舗
mostFreqCat 最もよく購入したカテゴリ
nCats 購入した異なるカテゴリ数
preferredBrand 最もよく購入したブランド
nBrands 購入した異なるブランド数

パッケージreadr、dplyr、corrplot、ggplot2はすでにインストール済みで読み込まれています。

指示

100 XP
  • データの概要を確認するために、構造を表示するコマンドstr()を使いましょう。
  • 次に、過去3か月の連続型の説明変数と今月の売上変数との相関を可視化します。関数cor()とcorrplot()、そしてパイプ演算子を使ってください。適切な変数の選択はすでに行われています。
  • さらに、カテゴリ変数preferredBrandの水準ごとのsalesThisMonの分布を示す箱ひげ図を作成します。カテゴリ変数の従属変数mostFreqStoreについては、同様の図がすでに用意されています。