Gruppenstatistiken zusammenfassen
Manchmal möchtest du verstehen, wie ein Wert zwischen verschiedenen Gruppen variiert. Wie variiert zum Beispiel der maximale Wert pro Gruppe zwischen den Gruppen?
Um das herauszufinden, fasse zunächst die Ergebnisse nach Gruppen zusammen und berechne dann eine zusammenfassende Statistik der Gruppenergebnisse. Eine Möglichkeit, dies zu tun, besteht darin, die Gruppenwerte in einer Unterabfrage zu berechnen und dann die Ergebnisse der Unterabfrage zusammenzufassen.
Wie hoch ist die Standardabweichung bei der maximalen Anzahl von Stack-Overflow-Fragen pro Tag über alle Schlagworte hinweg? Was ist mit dem Mittelwert, dem Minimalwert und dem Maximalwert der Höchstwerte?
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in SQL
Anleitung zur Übung
- Beginne damit, eine Unterabfrage zu schreiben, um
max()
vonquestion_count
pro Schlagwort zu berechnen; benenne das Ergebnis der Unterabfrage mit dem Aliasmaxval
. - Berechne dann die Standardabweichung von
maxval
mitstddev()
. - Berechne auch
min()
,max()
, undavg()
vonmaxval
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
-- Compute standard deviation of maximum values
SELECT ___(___),
-- min
___(___),
-- max
___(___),
-- avg
___(___)
-- Subquery to compute max of question_count by tag
FROM (SELECT ___(___) AS ___
FROM stackoverflow
-- Compute max by...
GROUP BY ___) AS max_results; -- alias for subquery