CommencerCommencer gratuitement

Distances d’édition vs. méthodes par q-grammes

Les résultats des différentes méthodes de distance entre chaînes peuvent beaucoup varier. Selon la méthode, les valeurs peuvent être inférieures à 1 ou supérieures à 10. C’est pourquoi il est utile de connaître le fonctionnement interne de chaque méthode.

Vous avez vu six méthodes, dont trois reposent sur une approche de « distance d’édition », qui mesure le nombre de modifications nécessaires pour transformer la première chaîne en la seconde.

Les trois autres fonctionnent différemment : elles découpent une chaîne en sous-chaînes d’une longueur donnée — les q-grammes (parfois appelés n-grammes). Vous souvenez-vous de quelles méthodes il s’agit ?

Cet exercice fait partie du cours

Expressions régulières intermédiaires en R

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice