Visualização de várias categorias
Até agora, neste capítulo, consideramos apenas o caso de diferenças em uma variável numérica entre duas categorias. É claro que muitos conjuntos de dados contêm mais categorias. Antes de você começar a realizar testes em muitas categorias, geralmente é útil fazer uma análise exploratória dos dados. Ou seja, calcular estatísticas resumidas para cada grupo e visualizar as distribuições da variável numérica para cada categoria usando gráficos de caixa.
Aqui, voltaremos aos dados de remessas atrasadas e como o preço de cada pacote (pack_price
) varia entre os três modos de remessa (shipment_mode
): "Air"
, "Air Charter"
, e "Ocean"
.
late_shipments
está disponível; dplyr
e ggplot2
estão carregados.
Este exercício faz parte do curso
Teste de hipóteses em R
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Using late_shipments, group by shipment mode, and calculate the mean and std dev of pack price
___