Encontrar una coincidencia para un error tipográfico en la búsqueda

La entrada humana es muy propensa a errores. La gente teclea mal todo tipo de textos, incluido su nombre o dirección, y como científico/a de datos tienes que encontrar una forma de manejarlo. Calcular distancias entre cadenas es una forma de abordar este problema.

En nuestro pequeño vector usernames encontrarás tres nombres distintos. Tu tarea será encontrar el nombre más cercano posible al nombre introducido "Emile Brown". ¿Puedes encontrar un nombre similar en el vector usernames? Usa amatch() para buscar en el vector e imprime una recomendación similar a la que has visto en Google.

Este ejercicio forma parte del curso

Expresiones regulares intermedias en R

Ver curso

Instrucciones del ejercicio

Especifica la distancia de edición máxima para la función amatch() como 1.
Usa el valor de retorno de amatch(), que está guardado en closest_index, para imprimir el nombre en usernames.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")

# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
  x = "Emile Brown",
  table = usernames,
  ___ = ___,
  method = "lv"
)

# Print the matched name in usernames at closest_index
print(glue(
  "Did you mean {name_matched}?",
  name_matched = ___
))

Editar y ejecutar código