IniziaInizia gratis

Verifica del dataset finale

A questo punto hai aggiunto sei nuove variabili al dataset originale abalone, aumentando il numero di colonne da 9 a 15. Hai anche filtrato (2+4+2) = 8 casi con vari errori di misurazione o registrazione dei dati, lasciandone 4169.

In questo esercizio verificherai questi numeri eseguendo dim() per controllare le dimensioni del dataset finale abaloneKeep. Farai anche alcune verifiche su questo dataset finale, rivedendo le statistiche descrittive di tutte le variabili e creando alcuni scatterplot per ricontrollare le assunzioni su pesi e dimensioni.

Il dataset abaloneKeep e i pacchetti dplyr e ggplot2 sono già stati caricati per te.

Questo esercizio fa parte del corso

R per utenti SAS

Visualizza il corso

Istruzioni dell'esercizio

  • Ottieni le dimensioni del dataset finale abaloneKeep.
  • Ottieni le statistiche descrittive di tutte le variabili in abaloneKeep.
  • Crea uno scatterplot con wholeWeight sull'asse x e shuckedWeight sull'asse y, aggiungi una linea di riferimento con intercetta 0 e pendenza 1.
  • Crea uno scatterplot con diameter sull'asse x e length sull'asse y, aggiungi una linea di riferimento con intercetta 0 e pendenza 1.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Dimensions of final dataset with samples in abaloneKeep
___

# Get summary statistics of all variables in abaloneKeep
___

# Scatterplot of shuckedWeight by wholeWeight add y=x line
ggplot(___) +
  ___ +
  ___

# Scatterplot of length by diameter add y=x line
ggplot(___) +
  ___ +
  ___
Modifica ed esegui il codice