1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでのデータクリーニング

Connected

演習

総仕上げ

この章では、文字列の類似度を使って zagat の city 列をクリーンアップし、さらに zagat と fodors からレストランのペアを生成して比較してきました。いよいよ仕上げです。あとはペアにスコアを付けて選別し、データをリンクすれば、すぐに分析を始められます!

reclin と dplyr は読み込まれており、zagat と fodors も利用可能です。

指示1 / 3

undefined XP
    1
    2
    3
  • レコードのペアに確率的なスコアを付けましょう。