CommencerCommencer gratuitement

Petite distance, petite différence

Dans la vidéo, vous avez vu qu’il existe plusieurs façons de mesurer la similarité ou la différence entre deux chaînes de caractères. Vous allez maintenant pratiquer avec le package stringdist pour calculer des distances entre chaînes selon différentes méthodes. Il est important de connaître plusieurs méthodes : certaines fonctionnent mieux sur certains jeux de données, tandis que d’autres sont plus adaptées à d’autres contextes.

Le package stringdist a été chargé pour vous.

Cet exercice fait partie du cours

Nettoyer des données avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate Damerau-Levenshtein distance
stringdist(___, ___, method = ___)
Modifier et exécuter le code