Eliminare livelli
La tabella di contingenza dell'esercizio precedente ha mostrato che ci sono alcuni livelli con conteggi molto bassi. Per semplificare l'analisi, spesso è utile eliminare questi livelli.
In R, servono due passaggi: prima filtri tutte le righe con i livelli che hanno conteggi molto bassi, poi rimuovi questi livelli dalla variabile fattore con droplevels(). Questo perché la funzione droplevels() mantiene i livelli che hanno solo 1 o 2 occorrenze; elimina solo i livelli che non esistono nel dataset.
Questo esercizio fa parte del corso
Analisi esplorativa dei dati in R
Istruzioni dell'esercizio
La tabella di contingenza dell'esercizio precedente è disponibile nel tuo workspace come tab.
- Carica il pacchetto
dplyr. - Stampa
tabper scoprire quale livello dialignha il numero totale di occorrenze più basso. - Usa
filter()per filtrare tutte le righe dicomicscon quel livello, poi elimina il livello non utilizzato condroplevels(). Salva il dataset semplificato comecomics_filtered.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load dplyr
___
# Print tab
___
# Remove align level
comics_filtered <- ___ %>%
___(align != ___) %>%
___()
# See the result
comics_filtered