1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong R

Connected

Bài tập

So sánh các cặp

Giờ bạn đã tạo được các cặp nhà hàng, hãy bắt đầu so sánh chúng. Bạn có thể tùy biến cách so sánh rất linh hoạt thông qua các đối số by và default_comparator. Không có một đáp án tuyệt đối cho việc nên đặt chúng là gì, nên trong bài này, bạn sẽ thử một vài lựa chọn.

Đã tải dplyr và reclin, đồng thời zagat và fodors cũng đã sẵn sàng.

Hướng dẫn 1/2

undefined XP
  • 1
    • So sánh các cặp theo name dùng khoảng cách lcs().
  • 2
    • So sánh các cặp theo name, phone, và addr dùng jaro_winkler().