Een typefout in een zoekopdracht matchen
Handmatige invoer is erg foutgevoelig. Mensen maken typefouten in allerlei teksten, zoals hun naam of adres, en jij als data scientist moet daar mee om kunnen gaan. Het berekenen van stringafstanden is één manier om dit probleem aan te pakken.
In onze kleine vector usernames staan drie verschillende namen. Jij gaat de naam zoeken die het dichtst in de buurt komt van de ingevoerde naam "Emile Brown". Kun je een vergelijkbare naam vinden in de vector usernames? Gebruik amatch() om de vector te doorzoeken en print een aanbeveling zoals je die op Google hebt gezien.
Deze oefening maakt deel uit van de cursus
Gevorderde reguliere expressies in R
Oefeninstructies
- Stel de maximale bewerkingsafstand voor de functie
amatch()in op1. - Gebruik de geretourneerde waarde van
amatch(), opgeslagen inclosest_index, om de naam inusernameste printen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")
# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
x = "Emile Brown",
table = usernames,
___ = ___,
method = "lv"
)
# Print the matched name in usernames at closest_index
print(glue(
"Did you mean {name_matched}?",
name_matched = ___
))