1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy predykcyjnej w Pythonie

Connected

ćwiczenie

Dyskretyzacja wybranej zmiennej

Aby tworzyć wykresy wglądu w predyktory dla zmiennych ciągłych, najpierw trzeba je zdyskretyzować. W Pythonie możesz zdyskretyzować kolumny pandas za pomocą metody qcut.

Aby sprawdzić, czy zmienna została poprawnie zdyskretyzowana, możesz zweryfikować, że przedziały mają równe rozmiary – użyj do tego metody groupby:

print(basetable.groupby("discretized_variable").size()

Instrukcje

100 XP
  • Użyj metody qcut, aby zdyskretyzować zmienną time_since_last_donation na 10 grup. Przypisz wynik do nowej kolumny o nazwie "bins_recency".
  • Użyj metody groupby, aby zweryfikować, że przedziały mają zbliżone rozmiary.