1. 学ぶ
  2. /
  3. コース
  4. /
  5. SQLで学ぶ探索的データ分析

Connected

演習

グループ統計量を要約する

値がグループ間でどのように変動するかを知りたいときがあります。たとえば、グループごとの最大値はグループ間でどのように違うでしょうか?

これを調べるには、まずグループごとに集計し、その結果に対して要約統計量を計算します。1つの方法は、サブクエリでグループの値を計算し、そのサブクエリの結果をさらに要約することです。

この演習では、Stack Overflow の1日あたりの質問数の「タグごとの最大値」について、タグ間の標準偏差はいくつになりますか? さらに、その最大値の平均、最小、最大も求めてみましょう。

指示

100 XP
  • まず、タグごとに question_count の max() を計算するサブクエリを書き、サブクエリの結果に maxval という別名を付けます。
  • つづいて、stddev() で maxval の標準偏差を計算します。
  • さらに、min()、max()、avg() で maxval の最小・最大・平均も計算します。