1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでのデータクリーニング

Connected

演習

テキストデータの不一致を検出する

カスタマーサポートチームが、SFOアンケートの参加者にいくつか追加の質問をしたいという連絡がありました。ただし、コールセンターで使っている自動発信ツールは、電話番号の書式がバラバラなため、すべてを正しく解析できません。調べてみると、電話番号がハイフン(-)で区切られているものもあれば、丸括弧((,))が使われているものもあることがわかりました。この演習では、どの電話番号にこうした問題があるのかを特定し、修正が必要なものを把握します。

dplyr と stringr は読み込まれており、sfo_survey が利用可能です。

指示1 / 2

undefined XP
  • 1
    • "-" を含む電話番号の行をフィルタリングします。
  • 2
    • "(" または ")" を含む電話番号の行をフィルタリングします。括弧を検索する際は fixed() を使うことを忘れないでください。