1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w analizie marketingowej w R

Connected

ćwiczenie

Analiza danych

Zbiór danych salesData jest wczytany do przestrzeni roboczej. Zawiera informacje o klientach z miesięcy pierwszego do trzeciego. Uwzględniona jest również sprzedaż z miesiąca czwartego. Poniższa tabela opisuje zmienne, których znaczenie może nie być oczywiste.

Zmienna Opis
id numer identyfikacyjny klienta
mostFreqStore sklep, w którym klient robił zakupy najczęściej
mostFreqCat kategoria produktów kupowanych najczęściej
nCats liczba różnych kategorii
preferredBrand marka kupowana najczęściej
nBrands liczba różnych marek

Biblioteki readr, dplyr, corrplot i ggplot2 zostały zainstalowane i wczytane.

Instrukcje

100 XP
  • Użyj funkcji str(), aby uzyskać ogólny przegląd danych.
  • Zwizualizuj korelację między ciągłymi zmiennymi objaśniającymi z trzech poprzednich miesięcy a zmienną sprzedaży z bieżącego miesiąca. Zastosuj funkcje cor() i corrplot() połączone operatorem potoku. Odpowiednie zmienne zostały już dla ciebie wybrane.
  • Na koniec stwórz wykres pudełkowy przedstawiający rozkład zmiennej salesThisMon w zależności od poziomów zmiennej kategorycznej preferredBrand. To samo zostało już wykonane dla kategorycznej zmiennej mostFreqStore.