1. Обучение
  2. /
  3. Курса
  4. /
  5. Очистка данных в Python

Connected

упражнение

Переназначение категорий II

В предыдущем упражнении вы определили, что пороговое значение расстояния для исправления опечаток в типах кухни 'american', 'asian' и 'italian' в столбце cuisine_type должно быть равно 80.

В этом упражнении вы соберёте всё воедино: найдёте совпадения с оценкой сходства не менее 80 с помощью функции extract() из fuzywuzzy.process для каждого корректного типа кухни и замените эти совпадения правильными значениями. Напомним: при сравнении строки с массивом строк с помощью process.extract() результатом является список кортежей, каждый из которых имеет вид:

(closest match, similarity score, index of match)

Датафрейм restaurants доступен в вашем окружении, а также список categories с корректными типами кухни: 'italian', 'asian' и 'american'.

Инструкции 1/4

undefined XP
    1
    2
    3
    4
  • Выведите все уникальные значения столбца cuisine_type в датафрейме restaurants.