1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでのデータクリーニング

Connected

演習

ペアの比較

レストランのペアを作成できたので、次はそれらを比較します。by 引数と default_comparator 引数を使うと、比較方法を柔軟にカスタマイズできます。どの設定が正解というわけではないので、この演習ではいくつかの選択肢を試してみます。

dplyr と reclin は読み込まれており、zagat と fodors が使用可能です。

指示1 / 2

undefined XP
  • 1
    • name を lcs() 距離で比較します。
  • 2
    • name、phone、addr を jaro_winkler() で比較します。