IniziaInizia gratis

Ispezione delle variabili

Ora che abbiamo aggiunto diverse nuove variabili a abaloneMod, la prossima serie di esercizi esplorerà la qualità dei dati usando statistiche descrittive e visualizzazioni grafiche.

Userai anche filter() per escludere casi (righe nel dataset abaloneMod) che presentano errori o valori illogici tramite la funzione dplyr::filter(). Per esempio, ci sono alcuni abalone con height pari a 0 mm: è un valore errato dovuto probabilmente a refusi o errori di misurazione.

Il dataset abaloneMod è già stato caricato per te insieme ai pacchetti dplyr e ggplot2. Dopo aver filtrato i casi, creerai una nuova copia modificata del dataset chiamata abaloneKeep, che conterrà i casi finali da utilizzare per le analisi nelle lezioni successive.

Questo esercizio fa parte del corso

R per utenti SAS

Visualizza il corso

Istruzioni dell'esercizio

  • Ottieni le statistiche descrittive per le altezze degli abalone.
  • Mantieni i casi con altezze maggiori di 0 e assegna questi casi al nuovo dataframe abaloneKeep.
  • Per gli abalone mantenuti in abaloneKeep, crea un istogramma delle altezze, che ora dovrebbero essere tutte maggiori di 0.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Pull height from abaloneMod and run summary()
___ %>% 
  ___ %>%
  ___

# Keep cases with height > 0 assign to abaloneKeep
___ <- ___ %>%
  ___

# Make histogram of updated heights in abaloneKeep
ggplot(___) +
  ___
Modifica ed esegui il codice