1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z caret w R

Connected

ćwiczenie

Porównanie imputacji KNN i imputacji medianą

Wszystkie kroki przetwarzania wstępnego w funkcji train() są wykonywane na zbiorze treningowym każdego foldu walidacji krzyżowej, dlatego raportowane metryki błędu uwzględniają już efekty przetwarzania wstępnego.

Dotyczy to również zastosowanej metody imputacji (np. knnImpute lub medianImpute). Jest to przydatne, bo pozwala porównać różne metody imputacji i wybrać tę, która daje najlepsze wyniki na danych spoza zbioru treningowego.

W twoim środowisku dostępne są obiekty median_model i knn_model, a także resamples, który zawiera wyniki resamplingowe obu modeli. Przyjrzyj się wynikom modeli, wywołując

dotplot(resamples, metric = "ROC")

i wybierz model, który najlepiej radzi sobie na danych spoza zbioru treningowego. Która metoda imputacji daje najwyższy wynik ROC poza próbą dla twojego modelu glm?

Instrukcje

50 XP

Możliwe odpowiedzi