Porównanie imputacji KNN i imputacji medianą

Wszystkie kroki przetwarzania wstępnego w funkcji train() są wykonywane na zbiorze treningowym każdego foldu walidacji krzyżowej, dlatego raportowane metryki błędu uwzględniają już efekty przetwarzania wstępnego.

Dotyczy to również zastosowanej metody imputacji (np. knnImpute lub medianImpute). Jest to przydatne, bo pozwala porównać różne metody imputacji i wybrać tę, która daje najlepsze wyniki na danych spoza zbioru treningowego.

W twoim środowisku dostępne są obiekty median_model i knn_model, a także resamples, który zawiera wyniki resamplingowe obu modeli. Przyjrzyj się wynikom modeli, wywołując

dotplot(resamples, metric = "ROC")

i wybierz model, który najlepiej radzi sobie na danych spoza zbioru treningowego. Która metoda imputacji daje najwyższy wynik ROC poza próbą dla twojego modelu glm?

Możliwe odpowiedzi

Imputacja KNN jest znacznie lepsza niż imputacja medianą.

Imputacja KNN jest nieznacznie lepsza niż imputacja medianą.

Imputacja medianą jest znacznie lepsza niż imputacja KNN.

Imputacja medianą jest nieznacznie lepsza niż imputacja KNN.

ćwiczenie

Porównanie imputacji KNN i imputacji medianą

Instrukcje

Możliwe odpowiedzi

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

Możliwe odpowiedzi

ćwiczenie