ComeçarComece de graça

Verificar conjunto de dados final

Neste ponto, você adicionou seis novas variáveis ao conjunto de dados original abalone, aumentando o número de colunas de 9 para 15. Você também filtrou (2+4+2) = 8 casos com diversos erros de medição ou de registro de dados, restando 4169 casos.

Neste exercício, você vai verificar esses números executando dim() para conferir as dimensões do conjunto de dados final abaloneKeep. Você também fará algumas verificações nesse conjunto final, revisando as estatísticas descritivas de todas as variáveis e criando mais alguns gráficos de dispersão para checar novamente as suposições sobre pesos e dimensões.

O conjunto de dados abaloneKeep e os pacotes dplyr e ggplot2 já foram carregados para você.

Este exercício faz parte do curso

R para Usuários de SAS

Ver curso

Instruções do exercício

  • Obtenha as dimensões do conjunto de dados final abaloneKeep.
  • Obtenha as estatísticas descritivas de todas as variáveis em abaloneKeep.
  • Faça um gráfico de dispersão com wholeWeight no eixo x e shuckedWeight no eixo y; adicione uma linha de referência com intercepto 0 e inclinação 1.
  • Faça um gráfico de dispersão com diameter no eixo x e length no eixo y; adicione uma linha de referência com intercepto 0 e inclinação 1.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Dimensions of final dataset with samples in abaloneKeep
___

# Get summary statistics of all variables in abaloneKeep
___

# Scatterplot of shuckedWeight by wholeWeight add y=x line
ggplot(___) +
  ___ +
  ___

# Scatterplot of length by diameter add y=x line
ggplot(___) +
  ___ +
  ___
Editar e executar o código