Ispezione delle variabili
Ora che abbiamo aggiunto diverse nuove variabili a abaloneMod, la prossima serie di esercizi esplorerà la qualità dei dati usando statistiche descrittive e visualizzazioni grafiche.
Userai anche filter() per escludere casi (righe nel dataset abaloneMod) che presentano errori o valori illogici tramite la funzione dplyr::filter(). Per esempio, ci sono alcuni abalone con height pari a 0 mm: è un valore errato dovuto probabilmente a refusi o errori di misurazione.
Il dataset abaloneMod è già stato caricato per te insieme ai pacchetti dplyr e ggplot2. Dopo aver filtrato i casi, creerai una nuova copia modificata del dataset chiamata abaloneKeep, che conterrà i casi finali da utilizzare per le analisi nelle lezioni successive.
Questo esercizio fa parte del corso
R per utenti SAS
Istruzioni dell'esercizio
- Ottieni le statistiche descrittive per le altezze degli abalone.
- Mantieni i casi con altezze maggiori di 0 e assegna questi casi al nuovo dataframe
abaloneKeep. - Per gli abalone mantenuti in
abaloneKeep, crea un istogramma delle altezze, che ora dovrebbero essere tutte maggiori di 0.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Pull height from abaloneMod and run summary()
___ %>%
___ %>%
___
# Keep cases with height > 0 assign to abaloneKeep
___ <- ___ %>%
___
# Make histogram of updated heights in abaloneKeep
ggplot(___) +
___