Resumir estatísticas por grupo
Às vezes você quer entender como um valor varia entre grupos. Por exemplo: como o valor máximo por grupo varia de um grupo para outro?
Para descobrir, primeiro faça um resumo por grupo e depois calcule estatísticas de resumo dos resultados por grupo. Uma forma de fazer isso é calcular os valores por grupo em uma subconsulta e, em seguida, resumir os resultados dessa subconsulta.
Neste exercício, qual é o desvio padrão, por tag, do número máximo de perguntas por dia no Stack Overflow? E quanto à média, ao mínimo e ao máximo desses máximos?
Este exercício faz parte do curso
Análise Exploratória de Dados em SQL
Instruções do exercício
- Comece escrevendo uma subconsulta para calcular o
max()dequestion_countpor tag; dê o aliasmaxvalpara o resultado da subconsulta. - Em seguida, calcule o desvio padrão de
maxvalcomstddev(). - Calcule também o
min(),max()eavg()demaxval.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
-- Compute standard deviation of maximum values
SELECT ___(___),
-- min
___(___),
-- max
___(___),
-- avg
___(___)
-- Subquery to compute max of question_count by tag
FROM (SELECT ___(___) AS ___
FROM stackoverflow
-- Compute max by...
GROUP BY ___) AS max_results; -- alias for subquery