1. 学ぶ
  2. /
  3. コース
  4. /
  5. SAS ユーザーのための R

Connected

演習

1 変数または複数変数の特定統計量

これまで見てきたように、summary()、psych::describe()、Hmisc::describe() といった関数を使うと、データセット内の 1 つまたは複数の変数について、多くの記述統計量を一度に取得できます。さらに、前の演習では mean()、median()、sd() などの関数を使って、個別の統計量も計算しました。

一方で、dplyr パッケージでは、summarise() 単体、または across(everything(), list()) の構文を組み合わせることで、関心のある複数のカスタム統計量を、1 度に 1 変数または複数変数に対してまとめて計算できます。

abaloneKeep データセットと dplyr パッケージはすでにロード済みです。

指示

100 XP
  • abaloneKeep データセットから、summary() を使って shucked weight と whole weight の要約統計量を取得します。
  • dplyr パッケージの summarise() 関数を使って、length の平均と標準偏差を求めます。出力名は平均を mean_length、標準偏差を sd_length としてください。
  • dplyr パッケージの summarise(across(everything(), list())) 構文を使って、height と diameter の平均と標準偏差を求めます。