Codifica delle variabili categoriche
A volte un insieme di dati contiene valori numerici che rappresentano una variabile categorica.
Nel dataset donors, wealth_rating usa numeri per indicare il livello di ricchezza del donatore:
- 0 = Sconosciuto
- 1 = Basso
- 2 = Medio
- 3 = Alto
Questo esercizio mostra come preparare questo tipo di variabile categorica ed esamina il suo impatto su un modello di regressione logistica. Il data frame donors è a tua disposizione.
Questo esercizio fa parte del corso
Apprendimento supervisionato in R: Classificazione
Istruzioni dell'esercizio
- Crea un fattore
wealth_levelsa partire dal numericowealth_ratingcon le etichette indicate, passando afactor()la colonna da convertire, i singoli livelli e le etichette. - Usa
relevel()per cambiare la categoria di riferimento inMedium. Il primo argomento deve essere la tua nuova colonnafactor. - Crea un modello di regressione logistica usando la colonna
wealth_levelsper prevederedonatede visualizza il risultato consummary().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Convert the wealth rating to a factor
donors$wealth_levels <- ___(___, levels = ___, labels = ___)
# Use relevel() to change reference category
donors$wealth_levels <- ___(___, ref = ___)
# See how our factor coding impacts the model
summary(___)