Visualizando os dados de crimes de Maryland
Antes de ajustar um modelo, fazer gráficos dos dados pode ajudar a ver se existem tendências ou pontos que chamam atenção, se há outliers ou se outros aspectos dos dados precisam ser considerados depois.
Usando ggplot2, você pode traçar linhas por condado e examinar como os crimes mudam ao longo do tempo.
Neste exercício, analise os dados de crimes de Maryland (md_crime). Eles incluem o Year, a contagem de crimes violentos (Crime) no condado e o nome do County.
Para explorar esses dados, primeiro faça o gráfico dos pontos para cada condado ao longo do tempo. Isso permite ver como cada condado muda com o tempo. Em vez de usar um recurso estético como color, aqui usamos group porque há muitos condados para distinguir facilmente pelas cores. Depois de plotar os dados brutos, adicione linhas de tendência para cada condado.
Tanto os pontos conectados (geom_line) quanto as linhas de tendência (geom_smooth) ajudam a entender se, e quais, tipos de efeitos aleatórios podem ser necessários. Se todos os pontos parecerem ter faixas e médias semelhantes, um intercepto de efeito aleatório pode não ser importante. Da mesma forma, se as tendências forem consistentes entre os condados (isto é, se as linhas de tendência parecerem semelhantes ou paralelas entre os grupos), uma inclinação de efeito aleatório pode não ser necessária.
Este exercício faz parte do curso
Modelos Hierárquicos e de Efeitos Mistos em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the change in crime through time by County
plot1 <-
ggplot(data = md_crime,
aes(x = ___, y = ___, group = ___)) +
geom_line() +
theme_minimal() +
ylab("Major crimes reported per county")
print(plot1)
# Add the trend line for each county
plot1 + ___