1. Nauka
  2. /
  3. Kursy
  4. /
  5. Marketing Analytics: Przewidywanie rezygnacji klientów w Pythonie

Connected

ćwiczenie

Obliczanie dokładności

Po podziale danych na zbiory treningowy i testowy możesz dopasować model do danych treningowych, a następnie przewidzieć etykiety dla danych testowych. To właśnie przećwiczysz w tym ćwiczeniu.

Do tej pory korzystałeś z regresji logistycznej i drzew decyzyjnych. Tym razem użyjesz RandomForestClassifier – czyli zespołu drzew decyzyjnych, który zazwyczaj osiąga lepsze wyniki niż pojedyncze drzewo.

Wyniki z poprzednich ćwiczeń są dostępne, a zbiory treningowy i testowy znajdziesz w zmiennych X_train, X_test, y_train i y_test.

Instrukcje

100 XP
  • Zaimportuj RandomForestClassifier z sklearn.ensemble.
  • Utwórz instancję RandomForestClassifier i przypisz ją do zmiennej clf.
  • Dopasuj clf do danych treningowych: X_train i y_train.
  • Oblicz dokładność modelu clf na danych testowych, korzystając z metody .score().