1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning for Marketing in Python

Connected

cvičení

Rozdělení dat na trénovací a testovací sadu

Teď jsi připraven/a sestavit kompletní model strojového učení pomocí několika jednoduchých kroků! Podrobnostem modelování se budeme věnovat v dalších kapitolách, ale zatím si procvičíš a pochopíš ty nejdůležitější z nich.

Nezávislé příznaky jsou načteny jako pandas DataFrame s názvem X a závislé hodnoty jako pandas Series s názvem Y.

Funkce train_test_split je již načtena z knihovny sklearn. Vytvoříš trénovací a testovací datové sady a ověříš, že data byla správně rozdělena.

Pokyny

100 XP
  • Rozděl X a Y na trénovací a testovací sadu tak, aby 25 % dat připadlo na testování.
  • Ověř, že trénovací sada obsahuje přesně 75 % původních dat.
  • Ověř, že testovací sada obsahuje přesně 25 % původních dat.