Résumer les statistiques du groupe
Vous souhaitez parfois comprendre comment une valeur varie d'un groupe à l'autre. Par exemple, comment la valeur maximale par groupe varie-t-elle d'un groupe à l'autre ?
Pour le savoir, résumez d'abord les résultats par groupe, puis calculez les statistiques récapitulatives des résultats du groupe. Une façon de procéder consiste à calculer les valeurs de groupe dans une sous-requête, puis à résumer les résultats de la sous-requête.
Pour cet exercice, quel est l'écart-type du nombre maximum de questions Stack Overflow par jour pour l'ensemble des étiquettes ? Qu'en est-il de la moyenne, du minimum et du maximum des maxima ?
Cet exercice fait partie du cours
Analyse exploratoire des données en SQL
Instructions
- Commencez par écrire une sous-requête pour calculer le
max()
dequestion_count
par étiquette ; donnez un alias au résultat de la sous-requête :maxval
. - Calculez ensuite l'écart-type de
maxval
avecstddev()
. - Calculez également
min()
,max()
etavg()
demaxval
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
-- Compute standard deviation of maximum values
SELECT ___(___),
-- min
___(___),
-- max
___(___),
-- avg
___(___)
-- Subquery to compute max of question_count by tag
FROM (SELECT ___(___) AS ___
FROM stackoverflow
-- Compute max by...
GROUP BY ___) AS max_results; -- alias for subquery