Bag of words
Binnen Natural Language Processing zijn n-grams een basismanier om kenmerken uit tekst te halen. n-grams tellen reeksen van woorden, waarbij n aangeeft uit hoeveel woord(en) een reeks bestaat. Zo tellen 2-grams bijvoorbeeld hoe vaak tweetallen van woorden voorkomen.
In deze oefening kun je tekst invoeren en zien wat de top 1-gram-, 2-gram- en 3-gram-kenmerken zijn op basis van frequentie. Weet je niet wat je moet invoeren? Probeer dan een van deze restaurantrecensies:
The food was not great and the service could be faster.
I've seen a lot of bad reviews about this place, but it was not that bad. You get what you pay for!
Welke van de volgende uitspraken is waar?
Deze oefening maakt deel uit van de cursus
Inzicht in Machine Learning
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen