Verificar conjunto de dados final
Neste ponto, você adicionou seis novas variáveis ao conjunto de dados original abalone, aumentando o número de colunas de 9 para 15. Você também filtrou (2+4+2) = 8 casos com diversos erros de medição ou de registro de dados, restando 4169 casos.
Neste exercício, você vai verificar esses números executando dim() para conferir as dimensões do conjunto de dados final abaloneKeep. Você também fará algumas verificações nesse conjunto final, revisando as estatísticas descritivas de todas as variáveis e criando mais alguns gráficos de dispersão para checar novamente as suposições sobre pesos e dimensões.
O conjunto de dados abaloneKeep e os pacotes dplyr e ggplot2 já foram carregados para você.
Este exercício faz parte do curso
R para Usuários de SAS
Instruções do exercício
- Obtenha as dimensões do conjunto de dados final
abaloneKeep. - Obtenha as estatísticas descritivas de todas as variáveis em
abaloneKeep. - Faça um gráfico de dispersão com
wholeWeightno eixo x eshuckedWeightno eixo y; adicione uma linha de referência com intercepto 0 e inclinação 1. - Faça um gráfico de dispersão com
diameterno eixo x elengthno eixo y; adicione uma linha de referência com intercepto 0 e inclinação 1.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Dimensions of final dataset with samples in abaloneKeep
___
# Get summary statistics of all variables in abaloneKeep
___
# Scatterplot of shuckedWeight by wholeWeight add y=x line
ggplot(___) +
___ +
___
# Scatterplot of length by diameter add y=x line
ggplot(___) +
___ +
___