Resumir las estadísticas del grupo
A veces quieres entender cómo varía un valor entre grupos. Por ejemplo, ¿cómo varía el valor máximo por grupo según los grupos?
Para averiguarlo, primero haz un resumen por grupos y luego calcula estadísticas resumidas de los resultados de los grupos. Una forma de hacerlo es calcular los valores de grupo en una subconsulta, y luego resumir los resultados de la subconsulta.
Para este ejercicio, ¿cuál es la desviación típica entre etiquetas en el número máximo de preguntas de Stack Overflow al día? ¿Y también la media, el mínimo y el máximo de los máximos?
Este ejercicio forma parte del curso
Análisis exploratorio de datos en SQL
Instrucciones del ejercicio
- Empieza escribiendo una subconsulta para calcular el
max()
dequestion_count
por etiqueta; alias el resultado de la subconsulta comomaxval
. - A continuación, calcula la desviación típica de
maxval
constddev()
. - Calcula también
min()
,max()
, yavg()
demaxval
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
-- Compute standard deviation of maximum values
SELECT ___(___),
-- min
___(___),
-- max
___(___),
-- avg
___(___)
-- Subquery to compute max of question_count by tag
FROM (SELECT ___(___) AS ___
FROM stackoverflow
-- Compute max by...
GROUP BY ___) AS max_results; -- alias for subquery