1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Redukcja skośności zmiennych

Teraz przekształcisz kolumny zbioru wholesale przy użyciu transformacji Boxa-Coxa, a następnie przeanalizujesz wykres par zmiennych, aby sprawdzić, czy skośność rozkładów została zmniejszona i czy stały się one bardziej zbliżone do normalnego. To kluczowy krok, który pozwala algorytmowi K-means poprawnie zbiegać i wykrywać jednorodne grupy (czyli klastry lub segmenty) obserwacji.

Moduł stats z biblioteki scipy jest już załadowany, a zbiór danych wholesale zaimportowano jako DataFrame biblioteki pandas.

Instrukcje

100 XP
  • Zdefiniuj niestandardową funkcję transformacji Boxa-Coxa, którą można zastosować do DataFrame'a biblioteki pandas.
  • Zastosuj tę funkcję do zbioru danych wholesale.
  • Narysuj wykres par zmiennych dla przekształconych danych.
  • Wyświetl wykres.