Visualização de várias categorias
Até agora, neste capítulo, consideramos apenas o caso de diferenças em uma variável numérica entre duas categorias. É claro que muitos conjuntos de dados contêm mais categorias. Antes de você começar a realizar testes em muitas categorias, geralmente é útil fazer uma análise exploratória dos dados. Ou seja, calcular estatísticas resumidas para cada grupo e visualizar as distribuições da variável numérica para cada categoria usando gráficos de caixa.
Aqui, voltaremos aos dados de remessas atrasadas e como o preço de cada pacote (pack_price) varia entre os três modos de remessa (shipment_mode): "Air", "Air Charter", e "Ocean".
late_shipments está disponível; dplyr e ggplot2 estão carregados.
Este exercício faz parte do curso
Teste de hipóteses em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Using late_shipments, group by shipment mode, and calculate the mean and std dev of pack price
___