1. Обучение
  2. /
  3. Курса
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

упражнение

Analiza wskaźnika rezygnacji i podział danych

Nawiązując do przeglądu z rozdziału 1., w tej lekcji zagłębisz się w przygotowanie danych potrzebnych do przewidywania rezygnacji klientów (churn) za pomocą uczenia maszynowego. Przeanalizujesz rozkład wskaźnika rezygnacji i podzielisz dane na zbiór treningowy oraz testowy, zanim przejdziesz do modelowania. W tym kroku zrozumiesz, jak rozłożony jest wskaźnik rezygnacji, a następnie wstępnie przetworzysz dane, aby zbudować model na zbiorze treningowym i zmierzyć jego skuteczność na zbiorze testowym.

Zbiór danych telecom został wczytany jako ramka danych pandas o nazwie telcom. Kolumna ze zmienną docelową nazywa się Churn.

Инструкции

100 XP
  • Wydrukuj unikalne wartości w kolumnie Churn.
  • Oblicz proporcjonalny udział każdej grupy rezygnacji.
  • Zaimportuj funkcję służącą do podziału danych na zbiór treningowy i testowy.
  • Podziel dane w proporcji 75% trening i 25% test.