Bewerkingsafstanden vs. q-grammethoden
De uitkomsten van verschillende stringafstandsmethoden kunnen sterk variëren. Bij de ene methode zijn de getallen kleiner dan één, bij een andere groter dan 10. Daarom is het handig om te weten hoe elke methode onder de motorkap werkt.
Je hebt zes methoden gezien, waarvan er drie werken met een "bewerkingsafstand" (edit distance): ze tellen hoeveel bewerkingen nodig zijn om de eerste string in de tweede te veranderen.
De andere drie werken anders: ze delen een string op in substrings van een bepaalde lengte — zogeheten q-grams (ook wel n-grams genoemd). Weet je nog welke methoden dat waren?
Deze oefening maakt deel uit van de cursus
Gevorderde reguliere expressies in R
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen