1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning s balíčkem caret v R

Connected

cvičení

Porovnání KNN a mediánové imputace

Všechny kroky předzpracování uvnitř funkce train() probíhají na trénovací části každého křížového ověřovacího foldu – výsledné chybové metriky tedy už zahrnují vliv předzpracování.

Týká se to i použité metody imputace (např. knnImpute nebo medianImpute). To je výhodné, protože ti umožňuje porovnat různé metody imputace a vybrat tu, která podává nejlepší výsledky na neviděných datech.

V pracovním prostředí máš k dispozici modely median_model a knn_model a také objekt resamples, který obsahuje výsledky resamplingů obou modelů. Výsledky modelů si prohlédni zavoláním

dotplot(resamples, metric = "ROC")

a vyber ten, který si vede nejlépe na neviděných datech. Která metoda imputace dosahuje nejvyššího skóre ROC mimo trénovací sadu pro tvůj model glm?

Pokyny

50 XP

Možné odpovědi