ComeçarComece de graça

KDE com muitos dados

O código fornecido cria um KDE básico de percentage_over_limit para todas as autuações. À primeira vista, as configurações fazem sentido. Temos muitos dados, então definimos uma largura de intervalo bem estreita: apenas um por cento. Além disso, o rug plot, que foi adicionado com cuidado, tem alpha reduzido para 0.7.

Ao executar esse código, você vai ver na hora que o gráfico não está bom. A estimativa de densidade parece um porco-espinho e o rug plot vira praticamente uma faixa preta grossa por causa da sobreposição massiva.

Corrija isso aumentando um pouco a largura do intervalo para 2.5 e reduzindo o alpha do rug plot para 0.05 para tentar perceber a sobreposição dos pontos. Não se esqueça de mudar o subtítulo para refletir a nova largura do kernel!

Este exercício faz parte do curso

Boas práticas de visualização em R

Ver curso

Instruções do exercício

  • Mude o desvio padrão do kernel para 2.5
  • Defina o alpha do rug plot como 0.05
  • Altere o subtitle para "Gaussian kernel SD = 2.5" para refletir a nova largura do kernel.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

ggplot(md_speeding, aes(x = percentage_over_limit)) +
    # Increase bin width to 2.5
    geom_density(fill = 'steelblue', bw = 1,  alpha = 0.7) + 
    # lower rugplot alpha to 0.05
    geom_rug(alpha = 0.5) + 
    labs(
        title = 'Distribution of % over speed limit', 
        # modify subtitle to reflect change in kernel width
        subtitle = "Gaussian kernel SD = 1"
    )
Editar e executar o código