1. 学习
  2. /
  3. 课程
  4. /
  5. Rでのデータクリーニング

Connected

练习

文字列距離でタイポを修正する

この章で扱うデータセットのひとつ zagat は、New York、Los Angeles、Atlanta、San Francisco、Las Vegas にあるレストラン情報です。Zagat はレストランのレビューを収集する企業で、このデータにはレストラン名、住所、電話番号などの情報が含まれています。

city 列にはレストランが所在する都市名が入っていますが、列全体にいくつもタイポがあります。あなたのタスクは、各 city を、cities データフレームに含まれる5つの正しい表記のいずれかに対応付けることです。

dplyr と fuzzyjoin は読み込まれており、zagat と cities は利用可能です。

说明 1 / 共 2 个

undefined XP
    1
    2
  • zagat 内の city 名のバリエーションごとの件数を数えてください。