ComeçarComece de graça

Visualizando os dados de crimes de Maryland

Antes de ajustar um modelo, fazer gráficos dos dados pode ajudar a ver se existem tendências ou pontos que chamam atenção, se há outliers ou se outros aspectos dos dados precisam ser considerados depois. Usando ggplot2, você pode traçar linhas por condado e examinar como os crimes mudam ao longo do tempo. Neste exercício, analise os dados de crimes de Maryland (md_crime). Eles incluem o Year, a contagem de crimes violentos (Crime) no condado e o nome do County.

Para explorar esses dados, primeiro faça o gráfico dos pontos para cada condado ao longo do tempo. Isso permite ver como cada condado muda com o tempo. Em vez de usar um recurso estético como color, aqui usamos group porque há muitos condados para distinguir facilmente pelas cores. Depois de plotar os dados brutos, adicione linhas de tendência para cada condado.

Tanto os pontos conectados (geom_line) quanto as linhas de tendência (geom_smooth) ajudam a entender se, e quais, tipos de efeitos aleatórios podem ser necessários. Se todos os pontos parecerem ter faixas e médias semelhantes, um intercepto de efeito aleatório pode não ser importante. Da mesma forma, se as tendências forem consistentes entre os condados (isto é, se as linhas de tendência parecerem semelhantes ou paralelas entre os grupos), uma inclinação de efeito aleatório pode não ser necessária.

Este exercício faz parte do curso

Modelos Hierárquicos e de Efeitos Mistos em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Plot the change in crime through time by County
plot1 <- 
	ggplot(data = md_crime, 
           aes(x = ___, y = ___, group = ___)) +
    geom_line() + 
    theme_minimal() +
    ylab("Major crimes reported per county")
print(plot1)

# Add the trend line for each county
plot1 + ___
Editar e executar o código