1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing Analytics in R

Connected

cvičení

Prozkoumání dat

Dataset salesData je načtený v pracovním prostředí. Obsahuje informace o zákaznících za první tři měsíce. Zahrnuty jsou pouze tržby za čtvrtý měsíc. Následující tabulka popisuje některé proměnné, jejichž význam nemusí být na první pohled zřejmý.

Proměnná Popis
id identifikační číslo zákazníka
mostFreqStore prodejna, ve které zákazník nakupoval nejčastěji
mostFreqCat kategorie, ze které zákazník nakupoval nejčastěji
nCats počet různých kategorií
preferredBrand značka, kterou zákazník nakupoval nejčastěji
nBrands počet různých značek

Balíčky readr, dplyr, corrplot a ggplot2 jsou nainstalovány a načteny.

Pokyny

100 XP
  • Použij příkaz str(), abys získal/a přehled o struktuře dat.
  • Vizualizuj korelaci spojitých vysvětlujících proměnných za uplynulé tři měsíce s prodejní proměnnou aktuálního měsíce. Použij funkce cor() a corrplot() propojené operátorem. Správné proměnné už jsou za tebe vybrané.
  • Vytvoř také krabicový graf zobrazující rozložení hodnot salesThisMon podle úrovní kategorické proměnné preferredBrand. Pro kategorickou proměnnou mostFreqStore to už bylo uděláno.