1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong R

Connected

Bài tập

Gộp tất cả lại

Trong chương này, bạn đã làm sạch cột city của zagat bằng cách dùng độ tương đồng chuỗi, đồng thời tạo và so sánh các cặp nhà hàng từ zagat và fodors. Sắp xong rồi — việc còn lại chỉ là chấm điểm và chọn các cặp phù hợp rồi liên kết dữ liệu với nhau; sau đó bạn có thể bắt đầu phân tích ngay!

reclin và dplyr đã được nạp và zagat cùng fodors đã sẵn sàng.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Chấm điểm các cặp bản ghi theo cách xác suất (probabilistic).