1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza danych IoT w Pythonie

Connected

ćwiczenie

Podział na zbiór treningowy i testowy

Aby uniknąć przeuczenia, w uczeniu maszynowym powszechną praktyką jest dzielenie danych na zbiór treningowy i testowy. Dzięki temu można sprawdzić, czy model poprawnie przewiduje nowe, niewidziane wcześniej dane.

Ponieważ pracujemy z danymi szeregów czasowych, nie możemy stosować losowego podziału – model mógłby w ten sposób „poznać przyszłość".

Dostępna jest funkcja show_start_end(), która wyświetla pierwszy i ostatni rekord ramki danych. Przyjmuje ramkę danych jako jedyny argument i zwraca ciąg znaków.

Dane są dostępne jako environment.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Zdefiniuj datę podziału jako "2018-10-27".
  • Podziel dane na train_env i test_env.