Distâncias de edição vs. métodos de q-gram
Os resultados de vários métodos de distância entre strings podem variar bastante. Em um método, os números podem ficar abaixo de um; em outro, acima de 10. Por isso, é útil entender como cada método funciona por dentro.
Você viu seis métodos, dos quais três seguem a abordagem de "distância de edição", medindo o número de edições necessárias para converter a primeira string na segunda.
Os outros três funcionam de forma diferente: eles dividem uma string em substrings de um certo comprimento — os chamados q-grams (às vezes também chamados de n-grams). Você se lembra quais métodos são esses?
Este exercício faz parte do curso
Expressões Regulares Intermediárias em R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício