Encontrar una coincidencia para un error tipográfico en la búsqueda
La entrada humana es muy propensa a errores. La gente teclea mal todo tipo de textos, incluido su nombre o dirección, y como científico/a de datos tienes que encontrar una forma de manejarlo. Calcular distancias entre cadenas es una forma de abordar este problema.
En nuestro pequeño vector usernames encontrarás tres nombres distintos. Tu tarea será encontrar el nombre más cercano posible al nombre introducido "Emile Brown". ¿Puedes encontrar un nombre similar en el vector usernames? Usa amatch() para buscar en el vector e imprime una recomendación similar a la que has visto en Google.
Este ejercicio forma parte del curso
Expresiones regulares intermedias en R
Instrucciones del ejercicio
- Especifica la distancia de edición máxima para la función
amatch()como1. - Usa el valor de retorno de
amatch(), que está guardado enclosest_index, para imprimir el nombre enusernames.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")
# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
x = "Emile Brown",
table = usernames,
___ = ___,
method = "lv"
)
# Print the matched name in usernames at closest_index
print(glue(
"Did you mean {name_matched}?",
name_matched = ___
))