1. 学ぶ
  2. /
  3. コース
  4. /
  5. sparklyr を使った Spark 入門(R)

Connected

演習

便利なヘルパー関数 (1)

データセットに数千もの列がある場合、select() を呼び出すたびに列名をひとつひとつ入力するのは非常に手間がかかります。そこで、select() には複数の列をまとめて選択できる便利なヘルパー関数が用意されています。

その中には starts_with() や ends_with() があり、それぞれ特定のプレフィックスまたはサフィックスで始まる・終わる列を選択できます。dplyr の特殊なコード評価の仕組みにより、これらの関数は select() の呼び出し内でのみ使用できます。単独では機能しないので注意しましょう。

指示

100 XP

Spark への接続は spark_conn として作成済みです。また、Spark に保存されたトラックのメタデータに紐付けられた tibble は track_metadata_tbl として定義済みです。

  • track_metadata_tbl から、"artist" で始まるすべての列を選択してください。
  • track_metadata_tbl から、"id" で終わるすべての列を選択してください。