CommencerCommencer gratuitement

Préparation des données

Vous développez un modèle de machine learning qui utilise le traitement du langage naturel (NLP) pour un projet d'analyse des sentiments visant à classer les avis sur les restaurants comme positifs, négatifs ou neutres. Afin de préparer les données pour l'entraînement, il est nécessaire de prétraiter et de représenter les données textuelles sous forme numérique.

Votre ensemble de données contient des milliers d'avis, dont l'un indique :

« Les plats étaient délicieux, mais le service était extrêmement lent. »

Quelles étapes de prétraitement du texte sont les plus susceptibles de supprimer les mots « mais » et « était » de cette critique ?

Cet exercice fait partie du cours

Concepts des grands modèles de langage (LLM)

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice