1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z caret w R

Connected

ćwiczenie

Tworzenie własnych indeksów treningowych i testowych

Jak pokazano w filmie, w tym rozdziale skupisz się na rzeczywistym zbiorze danych, który łączy wszystkie koncepcje omówione w poprzednich rozdziałach.

Zbiór danych churn zawiera informacje o różnych klientach firm telekomunikacyjnych. Zadanie modelowania polega na przewidzeniu, którzy klienci zrezygnują z usługi (ang. churn).

W tym rozdziale zapoznasz się z dwoma różnymi typami modeli predykcyjnych: glmnet i rf. Na początek należy stworzyć obiekt trainControl, który będzie można wielokrotnie wykorzystać do rzetelnego porównywania tych modeli.

Instrukcje

100 XP

W twoim środowisku pracy załadowane są churn_x i churn_y.

  • Użyj funkcji createFolds(), aby utworzyć 5 foldów walidacji krzyżowej na podstawie churn_y – zmiennej docelowej w tym ćwiczeniu.
  • Przekaż je do funkcji trainControl(), aby utworzyć wielokrotnego użytku obiekt trainControl służący do porównywania modeli.