1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ探索的データ分析

Connected

演習

代表値を計算する

この章では、世界各国の人口統計データを時系列で追跡した gapminder データを使用します。詳しくは、?gapminder でヘルプファイルを参照できます。

この演習では、大陸ごとに平均寿命がどのように異なるかに注目します。国単位ではなく、大陸単位に集計して分析する必要があります。これは、group_by() と summarize() を組み合わせることで可能になります。これは、データセットの異なるサブセットに同じ分析を適用するための非常に強力な書き方です。

指示

100 XP
  • 2007 年のデータのみを含む gap2007 というデータセットを作成します。
  • gap2007 を使って、各大陸の平均寿命の平均値と中央値を計算します。summarize() で生成される新しい列名は気にしなくてかまいません。
  • 各大陸の平均寿命の箱ひげ図を並べて作成し、中央値で見られた傾向を確認します。