ComeçarComece de graça

Resumir estatísticas por grupo

Às vezes você quer entender como um valor varia entre grupos. Por exemplo: como o valor máximo por grupo varia de um grupo para outro?

Para descobrir, primeiro faça um resumo por grupo e depois calcule estatísticas de resumo dos resultados por grupo. Uma forma de fazer isso é calcular os valores por grupo em uma subconsulta e, em seguida, resumir os resultados dessa subconsulta.

Neste exercício, qual é o desvio padrão, por tag, do número máximo de perguntas por dia no Stack Overflow? E quanto à média, ao mínimo e ao máximo desses máximos?

Este exercício faz parte do curso

Análise Exploratória de Dados em SQL

Ver curso

Instruções do exercício

  • Comece escrevendo uma subconsulta para calcular o max() de question_count por tag; dê o alias maxval para o resultado da subconsulta.
  • Em seguida, calcule o desvio padrão de maxval com stddev().
  • Calcule também o min(), max() e avg() de maxval.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

-- Compute standard deviation of maximum values
SELECT ___(___),
	   -- min
       ___(___),
       -- max
       ___(___),
       -- avg
       ___(___)
  -- Subquery to compute max of question_count by tag
  FROM (SELECT ___(___) AS ___
          FROM stackoverflow
         -- Compute max by...
         GROUP BY ___) AS max_results; -- alias for subquery
Editar e executar o código