CommencerCommencer gratuitement

Résumer les statistiques du groupe

Vous souhaitez parfois comprendre comment une valeur varie d'un groupe à l'autre. Par exemple, comment la valeur maximale par groupe varie-t-elle d'un groupe à l'autre ?

Pour le savoir, résumez d'abord les résultats par groupe, puis calculez les statistiques récapitulatives des résultats du groupe. Une façon de procéder consiste à calculer les valeurs de groupe dans une sous-requête, puis à résumer les résultats de la sous-requête.

Pour cet exercice, quel est l'écart-type du nombre maximum de questions Stack Overflow par jour pour l'ensemble des étiquettes ? Qu'en est-il de la moyenne, du minimum et du maximum des maxima ?

Cet exercice fait partie du cours

Analyse exploratoire des données en SQL

Afficher le cours

Instructions

  • Commencez par écrire une sous-requête pour calculer le max() de question_count par étiquette ; donnez un alias au résultat de la sous-requête : maxval.
  • Calculez ensuite l'écart-type de maxval avec stddev().
  • Calculez également min(), max() et avg() de maxval.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

-- Compute standard deviation of maximum values
SELECT ___(___),
	   -- min
       ___(___),
       -- max
       ___(___),
       -- avg
       ___(___)
  -- Subquery to compute max of question_count by tag
  FROM (SELECT ___(___) AS ___
          FROM stackoverflow
         -- Compute max by...
         GROUP BY ___) AS max_results; -- alias for subquery
Modifier et exécuter le code