ComeçarComece de graça

Encontrando uma correspondência para um erro de digitação na busca

A entrada de dados feita por pessoas é bastante suscetível a erros. As pessoas digitam textos errados de todo tipo, incluindo nome e endereço, e você, como cientista de dados, precisa encontrar uma forma de lidar com isso. Calcular distâncias entre strings é uma forma de atacar esse problema.

No nosso pequeno vetor usernames, você encontrará três nomes diferentes. Sua tarefa é encontrar o nome mais próximo possível do nome informado, "Emile Brown". Você consegue achar um nome semelhante no vetor usernames? Use amatch() para pesquisar no vetor e imprimir uma recomendação parecida com a que você vê no Google.

Este exercício faz parte do curso

Expressões Regulares Intermediárias em R

Ver curso

Instruções do exercício

  • Especifique a distância de edição máxima para a função amatch() como 1.
  • Use o valor de retorno de amatch(), que está armazenado em closest_index, para imprimir o nome em usernames.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")

# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
  x = "Emile Brown",
  table = usernames,
  ___ = ___,
  method = "lv"
)

# Print the matched name in usernames at closest_index
print(glue(
  "Did you mean {name_matched}?",
  name_matched = ___
))
Editar e executar o código