1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

cvičení

Přemapování kategorií II

V předchozím cvičení jsi zjistil/a, že hranice vzdálenosti pro přemapování překlepů typů kuchyně 'american', 'asian' a 'italian' uložených ve sloupci cuisine_type by měla být 80.

V tomto cvičení to celé spojíš dohromady: pomocí funkce extract() z fuzywuzzy.process najdeš shody se skóre podobnosti 80 a vyšším pro každý správný typ kuchyně a tyto shody jím nahradíš. Nezapomeň, že při porovnávání řetězce s polem řetězců pomocí process.extract() je výstupem seznam n-tic, kde každá má formát:

(nejbližší shoda, skóre podobnosti, index shody)

DataFrame restaurants je dostupný ve tvém prostředí a máš přístup k seznamu categories obsahujícímu správné typy kuchyně ('italian', 'asian' a 'american').

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vrať všechny unikátní hodnoty ze sloupce cuisine_type v DataFrame restaurants.