1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Podział danych na zbiór treningowy i testowy

Czas zbudować kompletny model uczenia maszynowego, wykonując kilka prostych kroków! Szczegóły dotyczące modelowania omówimy dokładniej w kolejnych rozdziałach, ale na razie przećwiczysz i poznasz kluczowe etapy tego procesu.

Niezależne cechy zostały wczytane jako obiekt pandas DataFrame o nazwie X, a wartości zależne jako obiekt pandas Series o nazwie Y.

Funkcja train_test_split z biblioteki sklearn jest już zaimportowana. Teraz stworzysz zbiory treningowy i testowy, a następnie sprawdzisz, czy dane zostały poprawnie podzielone.

Instrukcje

100 XP
  • Podziel X i Y na zbiory treningowy i testowy, przeznaczając 25% danych do testowania.
  • Upewnij się, że zbiór treningowy zawiera tylko 75% oryginalnych danych.
  • Upewnij się, że zbiór testowy zawiera tylko 25% oryginalnych danych.