1. Lära sig
  2. /
  3. Courses
  4. /
  5. Rで学ぶ中級正規表現

Connected

exercise

2つの条件に基づいて一致を見つける

この演習では、対応する映画タイトルを含む2つのデータセットを照合します。ただし、どちらにも誤字が含まれています。最初のテーブル movie_titles には、2つ目のテーブル movie_db と照合すべき10本の映画があります。これらはスキャンされた資料に基づいており、光学式文字認識(OCR)による誤りが含まれています。

両方のテーブルには title と year 列があります。これらを使って一致を見つけてください。

類似または一致するエントリを判定する補助関数を2つ作成します。1つは映画タイトル用(stringdist() に基づく)、もう1つは年を比較するためのもので、abs()(差分を返します)を使います。

Instruktioner 1 / 3

undefined XP
  • 1
    • 関数 is_string_distance_below_three() が、left と right の stringdistance が 3 未満のときに TRUE を返すようにします。
  • 2
    • is_closer_than_three_years() が、left と right の絶対差が 3 未満のときに TRUE を返すようにします。
  • 3
    • 補助関数を使って、2つのデータフレームを "title" と "year" の2列で結合します。