ComeçarComece de graça

Distâncias de edição vs. métodos de q-gram

Os resultados de vários métodos de distância entre strings podem variar bastante. Em um método, os números podem ficar abaixo de um; em outro, acima de 10. Por isso, é útil entender como cada método funciona por dentro.

Você viu seis métodos, dos quais três seguem a abordagem de "distância de edição", medindo o número de edições necessárias para converter a primeira string na segunda.

Os outros três funcionam de forma diferente: eles dividem uma string em substrings de um certo comprimento — os chamados q-grams (às vezes também chamados de n-grams). Você se lembra quais métodos são esses?

Este exercício faz parte do curso

Expressões Regulares Intermediárias em R

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício