1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe w marketingu w Pythonie

Connected

ćwiczenie

Oddzielanie cech od zmiennej docelowej

Po podziale danych na zbiór treningowy i testowy nadszedł czas na ostatni krok przed dopasowaniem modelu – oddzielenie cech i zmiennej docelowej do osobnych zbiorów danych. Skorzystasz z listy nazw kolumn, która została już wczytana.

Główny zbiór danych jest dostępny jako telcom i podzielony na zbiory treningowy oraz testowy, wczytane jako obiekty pandas DataFrame odpowiednio do train i test. Listy target i custid zawierają nazwy zmiennej docelowej oraz identyfikatora klienta. Twoim zadaniem jest utworzenie listy cols z nazwami pozostałych kolumn. Możesz swobodnie eksplorować zbiory danych w konsoli.

Instrukcje

100 XP
  • Zapisz w liście nazwy kolumn zbioru telcom, pomijając zmienną docelową i identyfikator klienta.
  • Wyodrębnij cechy treningowe i etykiety treningowe.
  • Wyodrębnij cechy testowe i etykiety testowe.