1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Podział danych na zbiór treningowy i testowy

Ostatni krok przed budową modelu regresji! Zidentyfikujesz nazwy zmiennej docelowej i kolumn cech, wyodrębnisz dane, a następnie podzielisz je na zbiór treningowy i testowy.

Biblioteki pandas i numpy zostały wczytane odpowiednio jako pd i np. Cechy wejściowe są zaimportowane jako zbiór danych features, a zmienna docelowa zbudowana w poprzednim ćwiczeniu — jako Y.

Instrukcje

100 XP
  • Zapisz nazwę kolumny identyfikatora klienta jako listę.
  • Wybierz nazwy kolumn cech, wykluczając kolumnę identyfikatora klienta.
  • Wyodrębnij cechy jako X.
  • Podziel dane na zbiór treningowy i testowy, używając funkcji train_test_split().