ComeçarComece de graça

Resumir as estatísticas do grupo

Às vezes, você quer entender como um valor varia entre os grupos. Por exemplo, como o valor máximo por grupo varia entre os grupos?

Para descobrir isso, primeiro você deve resumir por grupo e, em seguida, calcular as estatísticas resumidas dos resultados do grupo. Uma maneira de fazer isso é calcular os valores do grupo em uma subconsulta e, em seguida, resumir os resultados da subconsulta.

Para este exercício, qual é o desvio padrão entre as tags no número máximo de perguntas do Stack Overflow por dia? O que você acha da média, do mínimo e do máximo dos máximos também?

Este exercício faz parte do curso

Análise exploratória de dados em SQL

Ver curso

Instruções do exercício

  • Comece escrevendo uma subconsulta para calcular o max() de question_count por tag; coloque o nome do resultado da subconsulta como maxval.
  • Em seguida, calcule o desvio padrão de maxval com stddev().
  • Calcule também os endereços min(), max() e avg() de maxval.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

-- Compute standard deviation of maximum values
SELECT ___(___),
	   -- min
       ___(___),
       -- max
       ___(___),
       -- avg
       ___(___)
  -- Subquery to compute max of question_count by tag
  FROM (SELECT ___(___) AS ___
          FROM stackoverflow
         -- Compute max by...
         GROUP BY ___) AS max_results; -- alias for subquery
Editar e executar o código