1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu với Python

Connected

Bài tập

Nhà hàng tương tự

Trong bài tập trước, bạn đã tạo các cặp giữa restaurants và restaurants_new để ghép hai DataFrame một cách sạch sẽ bằng kỹ thuật liên kết bản ghi (record linkage).

Khi thực hiện record linkage, bạn có thể áp dụng nhiều kiểu đối sánh giữa các cột của DataFrame, bao gồm đối sánh chính xác, độ tương đồng chuỗi, và hơn thế nữa.

Giờ đây các cặp đã được tạo và lưu trong pairs, bạn sẽ tìm các đối sánh chính xác ở các cột city và cuisine_type cho mỗi cặp, và các chuỗi tương tự cho mỗi cặp ở cột rest_name. Cả hai thư viện pandas và recordlinkage đều có trong môi trường của bạn.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Khởi tạo một đối tượng so sánh bằng hàm recordlinkage.Compare().