Een typefout in een zoekopdracht matchen

Handmatige invoer is erg foutgevoelig. Mensen maken typefouten in allerlei teksten, zoals hun naam of adres, en jij als data scientist moet daar mee om kunnen gaan. Het berekenen van stringafstanden is één manier om dit probleem aan te pakken.

In onze kleine vector usernames staan drie verschillende namen. Jij gaat de naam zoeken die het dichtst in de buurt komt van de ingevoerde naam "Emile Brown". Kun je een vergelijkbare naam vinden in de vector usernames? Gebruik amatch() om de vector te doorzoeken en print een aanbeveling zoals je die op Google hebt gezien.

Deze oefening maakt deel uit van de cursus

Gevorderde reguliere expressies in R

Bekijk cursus

Oefeninstructies

Stel de maximale bewerkingsafstand voor de functie amatch() in op 1.
Gebruik de geretourneerde waarde van amatch(), opgeslagen in closest_index, om de naam in usernames te printen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")

# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
  x = "Emile Brown",
  table = usernames,
  ___ = ___,
  method = "lv"
)

# Print the matched name in usernames at closest_index
print(glue(
  "Did you mean {name_matched}?",
  name_matched = ___
))

Code bewerken en uitvoeren