Riepiloga le statistiche per gruppo
A volte vuoi capire come un valore varia tra i gruppi. Per esempio, come varia il valore massimo per gruppo tra i diversi gruppi?
Per scoprirlo, prima crea un riepilogo per gruppo e poi calcola le statistiche riassuntive dei risultati per gruppo. Un modo per farlo è calcolare i valori per gruppo in una sottoquery e poi riassumere i risultati della sottoquery.
Per questo esercizio, qual è la deviazione standard tra i tag nel numero massimo di domande di Stack Overflow per giorno? E qual è la media, il minimo e il massimo di questi massimi?
Questo esercizio fa parte del corso
Analisi esplorativa dei dati in SQL
Istruzioni dell'esercizio
- Inizia scrivendo una sottoquery per calcolare il
max()diquestion_countper tag; assegna l'aliasmaxvalal risultato della sottoquery. - Poi calcola la deviazione standard di
maxvalconstddev(). - Calcola anche
min(),max()eavg()dimaxval.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
-- Compute standard deviation of maximum values
SELECT ___(___),
-- min
___(___),
-- max
___(___),
-- avg
___(___)
-- Subquery to compute max of question_count by tag
FROM (SELECT ___(___) AS ___
FROM stackoverflow
-- Compute max by...
GROUP BY ___) AS max_results; -- alias for subquery