Visualização de muitas variáveis
À medida que você começa a considerar mais variáveis, traçar todas elas ao mesmo tempo se torna cada vez mais difícil. Além de usar escalas x e y para duas variáveis numéricas, você pode usar cores para uma terceira variável numérica e pode usar facetas para variáveis categóricas. E esse é o seu limite antes que os enredos se tornem muito difíceis de interpretar. Existem alguns tipos de gráficos especializados, como mapas de calor de correlação e gráficos de coordenadas paralelas, que podem lidar com mais variáveis, mas eles fornecem a você muito menos informações sobre cada variável e não são excelentes para visualizar previsões de modelos.
Aqui você ampliará os limites do gráfico de dispersão mostrando o preço da casa, a distância até a estação MRT, o número de lojas de conveniência próximas e a idade da casa, tudo junto em um único gráfico.
taiwan_real_estate
está disponível; ggplot2
está carregado.
Este exercício faz parte do curso
Regressão intermediária no R
Instruções de exercício
- Usando o conjunto de dados
taiwan_real_estate
, desenhe um gráfico de dispersão den_convenience
versus a raiz quadrada dedist_to_mrt_m
, colorido porprice_twd_msq
. - Use a escala de cores de plasma viridis contínua.
- Facetar o gráfico, envolvendo-o em
house_age_years
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Using taiwan_real_estate, no. of conv. stores vs. sqrt of dist. to MRT, colored by plot house price
___ +
# Make it a scatter plot
___ +
# Use the continuous viridis plasma color scale
___ +
# Facet, wrapped by house age
___