1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing Analytics in R

Connected

cvičení

Data pro analýzu přežití

V následujících cvičeních budeš pracovat s daty zákazníků internetového obchodu, abys procvičil/a analýzu přežití. Tentokrát ale nejde o čas do odchodu zákazníka, ale o čas do druhé objednávky.

Data jsou uložena v objektu dataNextOrder. Proměnná boughtAgain nabývá hodnoty 0 pro zákazníky pouze s jednou objednávkou a hodnoty 1 pro zákazníky, kteří již zadali druhou objednávku. Pokud zákazník objednal podruhé, uvidíš v proměnné daysSinceFirstPurch počet dní mezi první a druhou objednávkou. U zákazníků bez druhé objednávky obsahuje daysSinceFirstPurch dobu od jejich první (a zároveň poslední) objednávky.

Balíček ggplot2 je již načtený v tvém pracovním prostředí.

Pokyny

100 XP
  • Prohlédni si data pomocí funkce head().
  • Vykresli histogram počtu dní od první objednávky zvlášť pro zákazníky s druhou objednávkou a bez ní. (Pokud ggplot2 moc neznáš, neboj se: stačí použít daysSinceFirstPurch jako proměnnou na ose x a boughtAgain jako proměnnou pro výplň a rozdělení do panelů.)