1. Nauka
  2. /
  3. Kursy
  4. /
  5. Metody zespołowe w Pythonie

Connected

ćwiczenie

Przewidywanie śmierci w GoT

Zmienna docelowa nie zawiera brakujących wartości, jednak inne cechy już tak. Ponieważ kurs nie skupia się na czyszczeniu i przetwarzaniu danych, wykonaliśmy już następujące kroki wstępne:

  • Zastąpiono wartości NA przez 0.
  • Zastąpiono ujemne wartości wieku przez 0.
  • Zastąpiono wartości NA wieku średnią.

Teraz zbudujemy model zespołowy z użyciem techniki uśredniania. Przygotowano następujące modele indywidualne:

  • Regresja logistyczna (clf_lr).
  • Drzewo decyzyjne (clf_dt).
  • Maszyna wektorów nośnych (clf_svm).

Ponieważ zmienna docelowa jest binarna, każdy z tych modeli może osiągać dobre wyniki samodzielnie. Twoim zadaniem jest połączenie ich za pomocą uśredniania. Jak wyjaśniono w filmie, jest to równoważne podejściu głosowania miękkiego (ang. soft voting), dlatego nadal należy użyć VotingClassifier().

Instrukcje

100 XP
  • Utwórz listę krotek (string, estymator). Użyj 'lr' dla clf_lr, 'dt' dla clf_dt oraz 'svm' dla clf_svm.
  • Zbuduj klasyfikator uśredniający o nazwie clf_avg. Pamiętaj, aby podać odpowiedni argument dla parametru voting.