1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Analýza dat z IoT v Pythonu

Connected

cvičení

Rozdělení na trénovací a testovací sadu

Aby se předešlo přetrénování modelu, je v Machine Learning běžnou praxí rozdělit data na trénovací a testovací sadu. Tím zajistíme, že model dokáže správně předpovídat nová, dosud neviděná data.

Protože pracujeme s časovými řadami, nemůžeme použít náhodné dělení – model by tak mohl „vidět do budoucnosti".

K dispozici máš funkci show_start_end(), která vytiskne začátek a konec DataFrame. Přijímá DataFrame jako jediný argument a vrací řetězec.

Data jsou dostupná jako environment.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Definuj datum dělicího bodu jako "2018-10-27".
  • Rozděl data na train_env a test_env.