Bag-of-words
Binnen Natural Language Processing zijn n-grams een basismanier om kenmerken uit tekst te halen. n-grams tellen de opeenvolging van woorden en n geeft aan hoeveel woord(en) een reeks bevat. Zo tellen 2-grams bijvoorbeeld hoe vaak twee-woordcombinaties voorkomen.
Kies in deze oefening een voorbeeldtekst en een sequentielengte (n) om de meest voorkomende 1-gram-, 2-gram- en 3-gram-kenmerken te zien, samen met hoe vaak elk voorkomt.
Welke van de volgende uitspraken is waar?
Deze oefening maakt deel uit van de cursus
Inzicht in Machine Learning
Interactieve oefening met praktijkervaring
Zet theorie om in actie met een van onze interactieve oefeningen
Begin oefening