IniziaInizia gratis

Codifica delle variabili categoriche

A volte un insieme di dati contiene valori numerici che rappresentano una variabile categorica.

Nel dataset donors, wealth_rating usa numeri per indicare il livello di ricchezza del donatore:

  • 0 = Sconosciuto
  • 1 = Basso
  • 2 = Medio
  • 3 = Alto

Questo esercizio mostra come preparare questo tipo di variabile categorica ed esamina il suo impatto su un modello di regressione logistica. Il data frame donors è a tua disposizione.

Questo esercizio fa parte del corso

Apprendimento supervisionato in R: Classificazione

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un fattore wealth_levels a partire dal numerico wealth_rating con le etichette indicate, passando a factor() la colonna da convertire, i singoli livelli e le etichette.
  • Usa relevel() per cambiare la categoria di riferimento in Medium. Il primo argomento deve essere la tua nuova colonna factor.
  • Crea un modello di regressione logistica usando la colonna wealth_levels per prevedere donated e visualizza il risultato con summary().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)

# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)

# See how our factor coding impacts the model
summary(___)
Modifica ed esegui il codice