Encontrando uma correspondência para um erro de digitação na busca
A entrada de dados feita por pessoas é bastante suscetível a erros. As pessoas digitam textos errados de todo tipo, incluindo nome e endereço, e você, como cientista de dados, precisa encontrar uma forma de lidar com isso. Calcular distâncias entre strings é uma forma de atacar esse problema.
No nosso pequeno vetor usernames, você encontrará três nomes diferentes. Sua tarefa é encontrar o nome mais próximo possível do nome informado, "Emile Brown". Você consegue achar um nome semelhante no vetor usernames? Use amatch() para pesquisar no vetor e imprimir uma recomendação parecida com a que você vê no Google.
Este exercício faz parte do curso
Expressões Regulares Intermediárias em R
Instruções do exercício
- Especifique a distância de edição máxima para a função
amatch()como1. - Use o valor de retorno de
amatch(), que está armazenado emclosest_index, para imprimir o nome emusernames.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")
# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
x = "Emile Brown",
table = usernames,
___ = ___,
method = "lv"
)
# Print the matched name in usernames at closest_index
print(glue(
"Did you mean {name_matched}?",
name_matched = ___
))