1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Modelowanie z tidymodels w R

Connected

Exercise

Proces inżynierii cech

Aby włączyć inżynierię cech do procesu modelowania, zbiory treningowy i testowy muszą zostać przetworzone przed etapem dopasowywania modelu. Dzięki umiejętnościom zdobytym w tym rozdziale będziesz w stanie wykorzystać wszystkie dostępne zmienne predykcyjne z danych telekomunikacyjnych do trenowania modelu regresji logistycznej.

W tym ćwiczeniu stworzysz potok inżynierii cech dla danych telekomunikacyjnych i użyjesz go do transformacji zbiorów treningowego i testowego.

Do twojej sesji zostały wczytane zbiory danych telecom_training i telecom_test oraz specyfikacja modelu regresji logistycznej logistic_model.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Utwórz obiekt recipe o nazwie telecom_recipe, który ustawia zmienną wynikową na canceled_service, a wszystkie pozostałe kolumny ze zbioru telecom_training jako zmienne predykcyjne.
  • Korzystając z funkcji selekcji, usuń skorelowane predyktory przy progu 0,8, zastosuj transformację logarytmiczną do wszystkich numerycznych predyktorów, znormalizuj wszystkie numeryczne predyktory i utwórz zmienne dummy dla wszystkich nominalnych zmiennych predykcyjnych.