1. Дізнатися
  2. /
  3. Courses
  4. /
  5. Очищення даних у Python

Connected

exercise

Повторне віднесення категорій II

У попередній вправі ви визначили, що граничне значення дистанції для повторного віднесення друкарських помилок у типах кухні 'american', 'asian' і 'italian', збережених у стовпці cuisine_type, має бути 80.

У цій вправі ви об’єднаєте все разом: знайдете збіги з показником схожості 80 або вище, використовуючи функцію extract() з fuzywuzzy.process для кожного правильного типу кухні, і заміните ці збіги на коректну категорію. Пам’ятайте: коли ви порівнюєте рядок з масивом рядків за допомогою process.extract(), результат — це список кортежів у такому форматі:

(найближчий збіг, показник схожості, індекс збігу)

Датафрейм restaurants доступний у вашому середовищі, а також список categories, що містить правильні типи кухні ('italian', 'asian' і 'american').

Інструкції 1 / 4

undefined XP
    1
    2
    3
    4
  • Поверніть усі унікальні значення в стовпці cuisine_type датафрейму restaurants.