1. Nauka
  2. /
  3. Kursy
  4. /
  5. Segmentacja klientów w Pythonie

Connected

ćwiczenie

Przetwarzanie wstępne danych

Pierwszym krokiem w procesie segmentacji jest wstępne przetworzenie danych. Zastosujesz transformację logarytmiczną, a następnie znormalizujesz dane, aby przygotować je do klasteryzacji.

Zbiór danych z wartościami RFMT został wczytany jako datamart_rfmt. Biblioteka pandas jest dostępna jako pd, a numpy jako np.

Zachęcamy do eksploracji rozszerzonego zbioru danych RFMT w konsoli.

Instrukcje

100 XP
  • Zaimportuj StandardScaler, zainicjalizuj go i zapisz jako scaler.
  • Zastosuj transformację logarytmiczną do surowych danych RFMT.
  • Zainicjalizuj skaler i dopasuj go do danych po transformacji logarytmicznej.
  • Przekształć dane i zapisz przeskalowany wynik jako datamart_rfmt_normalized.