1. Learn
  2. /
  3. คอร์ส
  4. /
  5. Machine Learning for Marketing in Python

Connected

แบบฝึกหัด

Prozkoumání míry odlivu a rozdělení dat

V návaznosti na přehled z kapitoly 1 se v této lekci ponoříš hlouběji do přípravy dat potřebné pro predikci odlivu zákazníků pomocí strojového učení. Prozkoumáš rozložení odlivu a rozdělíš data na trénovací a testovací část, než přistoupíš k samotnému modelování. V tomto kroku pochopíš, jak je míra odlivu rozložena, a data připravíš tak, abys mohl/a sestavit model na trénovací sadě a změřit jeho výkon na dosud nepoužitých testovacích datech.

Telekomová datová sada je načtena jako pandas DataFrame s názvem telcom. Sloupec s cílovou proměnnou se jmenuje Churn.

คำแนะนำ

100 XP
  • Vypiš unikátní hodnoty ve sloupci Churn.
  • Vypočítej relativní zastoupení každé skupiny odlivu zákazníků.
  • Importuj funkci pro rozdělení dat na trénovací a testovací sadu.
  • Rozdělíš data v poměru 75 % pro trénování a 25 % pro testování.