1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Segmentace zákazníků v Pythonu

Connected

cvičení

Předzpracování RFM dat

Dataset s RFM hodnotami, které jsi vypočítal/a dříve, je načtený jako datamart_rfm. Protože proměnné mají zešikmené rozdělení a různé měřítko, teď je zbavíš zešikmení a normalizuješ je.

Knihovna pandas je načtená jako pd a numpy jako np. Než začneš, prozkoumej datamart_rfm v konzoli.

Pokyny

100 XP
  • Aplikuj logaritmickou transformaci pro odstranění zešikmení v datamart_rfm a výsledek ulož jako datamart_log.
  • Vytvoř instanci StandardScaler() s názvem scaler a natrénuj ji na datech datamart_log.
  • Transformuj data jejich škálováním a centrováním pomocí scaler.
  • Vytvoř pandas DataFrame z datamart_normalized a přidej mu názvy indexů a sloupců z datamart_rfm.