1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

cvičení

Podobné restaurace

V předchozím cvičení jsi generoval/a páry mezi restaurants a restaurants_new s cílem čistě sloučit oba DataFramy pomocí record linkage.

Při provádění record linkage můžeš mezi různými sloupci svých DataFramů používat různé typy porovnávání – přesné shody, podobnost řetězců a další.

Teď, když jsou tvoje páry vygenerované a uložené v pairs, najdeš přesné shody ve sloupcích city a cuisine_type pro každý pár a podobné řetězce ve sloupci rest_name. Oba DataFramy, pandas i recordlinkage jsou dostupné v tvém prostředí.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vytvoř objekt pro porovnávání pomocí funkce recordlinkage.Compare().