KDE com muitos dados
O código fornecido cria um KDE básico de percentage_over_limit para todas as autuações. À primeira vista, as configurações fazem sentido. Temos muitos dados, então definimos uma largura de intervalo bem estreita: apenas um por cento. Além disso, o rug plot, que foi adicionado com cuidado, tem alpha reduzido para 0.7.
Ao executar esse código, você vai ver na hora que o gráfico não está bom. A estimativa de densidade parece um porco-espinho e o rug plot vira praticamente uma faixa preta grossa por causa da sobreposição massiva.
Corrija isso aumentando um pouco a largura do intervalo para 2.5 e reduzindo o alpha do rug plot para 0.05 para tentar perceber a sobreposição dos pontos. Não se esqueça de mudar o subtítulo para refletir a nova largura do kernel!
Este exercício faz parte do curso
Boas práticas de visualização em R
Instruções do exercício
- Mude o desvio padrão do kernel para
2.5 - Defina o
alphado rug plot como0.05 - Altere o
subtitlepara"Gaussian kernel SD = 2.5"para refletir a nova largura do kernel.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
ggplot(md_speeding, aes(x = percentage_over_limit)) +
# Increase bin width to 2.5
geom_density(fill = 'steelblue', bw = 1, alpha = 0.7) +
# lower rugplot alpha to 0.05
geom_rug(alpha = 0.5) +
labs(
title = 'Distribution of % over speed limit',
# modify subtitle to reflect change in kernel width
subtitle = "Gaussian kernel SD = 1"
)