1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing in Python

Connected

cvičení

Rozdělení dat na trénovací a testovací

Poslední krok před tím, než se pustíme do tvorby regresního modelu! Identifikuješ názvy cílové proměnné a sloupců příznaků, extrahuješ data a rozdělíš je na trénovací a testovací část.

Knihovny pandas a numpy jsou načteny jako pd a np. Vstupní příznaky jsou importovány jako dataset features a cílová proměnná, kterou jsi sestavil/a v předchozím cvičení, je importována jako Y.

Pokyny

100 XP
  • Ulož název sloupce s identifikátorem zákazníka jako seznam.
  • Vyber názvy sloupců příznaků s vyloučením sloupce identifikátoru zákazníka.
  • Extrahuj příznaky jako X.
  • Rozděl data na trénovací a testovací část pomocí funkce train_test_split().