Resumir as estatísticas do grupo
Às vezes, você quer entender como um valor varia entre os grupos. Por exemplo, como o valor máximo por grupo varia entre os grupos?
Para descobrir isso, primeiro você deve resumir por grupo e, em seguida, calcular as estatísticas resumidas dos resultados do grupo. Uma maneira de fazer isso é calcular os valores do grupo em uma subconsulta e, em seguida, resumir os resultados da subconsulta.
Para este exercício, qual é o desvio padrão entre as tags no número máximo de perguntas do Stack Overflow por dia? O que você acha da média, do mínimo e do máximo dos máximos também?
Este exercício faz parte do curso
Análise exploratória de dados em SQL
Instruções do exercício
- Comece escrevendo uma subconsulta para calcular o
max()
dequestion_count
por tag; coloque o nome do resultado da subconsulta comomaxval
. - Em seguida, calcule o desvio padrão de
maxval
comstddev()
. - Calcule também os endereços
min()
,max()
eavg()
demaxval
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
-- Compute standard deviation of maximum values
SELECT ___(___),
-- min
___(___),
-- max
___(___),
-- avg
___(___)
-- Subquery to compute max of question_count by tag
FROM (SELECT ___(___) AS ___
FROM stackoverflow
-- Compute max by...
GROUP BY ___) AS max_results; -- alias for subquery