Datavoorbereiding
Je bouwt een Machine Learning-model dat NLP gebruikt voor een sentimentanalyseproject dat restaurantrecensies classificeert als positief, negatief of neutraal. Om de data voor training voor te bereiden, moet je de tekstgegevens voorbewerken en numeriek representeren.
Je gegevensset bevat duizenden recensies, waarvan er één luidt:
"The food was delicious, but the service was extremely slow."
Welke tekstvoorbewerkingsstappen verwijderen hoogstwaarschijnlijk de woorden "but" en "was" uit deze recensie?
Deze oefening maakt deel uit van de cursus
Concepten van Large Language Models (LLMs)
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen