1. 学ぶ
  2. /
  3. コース
  4. /
  5. tidyverse で学ぶカテゴリ型データ

Connected

演習

文字列のクレンジング

このレッスンでは、一般的なパターンを表現できる「正規表現(regex)」の基本を学びました。ここでは次の2つの表記を扱いました。

Expression Does this
. 任意の1文字にマッチ
* 直前の要素の0回以上の繰り返しにマッチ

たとえば、".*science " は文字列 "data science rocks!" の中の "data science " にマッチします。

前のレッスンで作成したデータセット gathered_data で、学んだことを使って response_var を変換してみましょう。

指示

100 XP
  • response_var 列で、str_remove を使って "rude to "(末尾のスペースも含む)より前とそれを含む部分をすべて取り除きます。
  • response_var 列から str_remove を使って "on a plane" を取り除きます。