1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Rでのデータクリーニング

Connected

अभ्यास

文字列距離でタイポを修正する

この章で扱うデータセットのひとつ zagat は、New York、Los Angeles、Atlanta、San Francisco、Las Vegas にあるレストラン情報です。Zagat はレストランのレビューを収集する企業で、このデータにはレストラン名、住所、電話番号などの情報が含まれています。

city 列にはレストランが所在する都市名が入っていますが、列全体にいくつもタイポがあります。あなたのタスクは、各 city を、cities データフレームに含まれる5つの正しい表記のいずれかに対応付けることです。

dplyr と fuzzyjoin は読み込まれており、zagat と cities は利用可能です。

निर्देश 1/2

undefined XP
    1
    2
  • zagat 内の city 名のバリエーションごとの件数を数えてください。