ComeçarComece gratuitamente

Visualização de muitas variáveis

À medida que você começa a considerar mais variáveis, traçar todas elas ao mesmo tempo se torna cada vez mais difícil. Além de usar escalas x e y para duas variáveis numéricas, você pode usar cores para uma terceira variável numérica e pode usar facetas para variáveis categóricas. E esse é o seu limite antes que os enredos se tornem muito difíceis de interpretar. Existem alguns tipos de gráficos especializados, como mapas de calor de correlação e gráficos de coordenadas paralelas, que podem lidar com mais variáveis, mas eles fornecem a você muito menos informações sobre cada variável e não são excelentes para visualizar previsões de modelos.

Aqui você ampliará os limites do gráfico de dispersão mostrando o preço da casa, a distância até a estação MRT, o número de lojas de conveniência próximas e a idade da casa, tudo junto em um único gráfico.

taiwan_real_estate está disponível; ggplot2 está carregado.

Este exercício faz parte do curso

Regressão intermediária no R

Ver Curso

Instruções de exercício

  • Usando o conjunto de dados taiwan_real_estate, desenhe um gráfico de dispersão de n_convenience versus a raiz quadrada de dist_to_mrt_m, colorido por price_twd_msq.
  • Use a escala de cores de plasma viridis contínua.
  • Facetar o gráfico, envolvendo-o em house_age_years.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Using taiwan_real_estate, no. of conv. stores vs. sqrt of dist. to MRT, colored by plot house price
___ +
  # Make it a scatter plot
  ___ +
  # Use the continuous viridis plasma color scale
  ___ +
  # Facet, wrapped by house age
  ___
Editar e executar código