Aan de slagGa gratis aan de slag

Categorieën opnieuw toewijzen II

In de vorige oefening heb je bepaald dat de drempelwaarde voor het opnieuw toewijzen van typfouten in de keukenstijlen 'american', 'asian' en 'italian' in de kolom cuisine_type 80 moet zijn.

In deze oefening ga je alles samenbrengen door voor elke correcte keukenstijl met fuzywuzzy.process's extract()-functie matches te vinden met een overeenkomstscore van 80 of hoger, en deze te vervangen door de juiste waarde. Onthoud dat wanneer je een string vergelijkt met een array van strings met process.extract(), de output een lijst van tuples is met het volgende formaat:

(closest match, similarity score, index of match)

De DataFrame restaurants staat in je omgeving, en je hebt toegang tot een categories-lijst met de correcte keukenstijlen ('italian', 'asian' en 'american').

Deze oefening maakt deel uit van de cursus

Data opschonen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Inspect the unique values of the cuisine_type column
print(____)
Code bewerken en uitvoeren