CommencerCommencer gratuitement

Exploration du jeu de données 20 News Groups

Dans cet exercice, vous allez travailler sur un échantillon du jeu de données 20 News Groups obtenu avec la fonction fetch_20newsgroups() de sklearn.datasets, en ne gardant que trois classes : sci.space, alt.atheism et soc.religion.christian.

Le jeu de données est chargé dans la variable news_dataset. Ses attributs sont affichés afin que vous puissiez les explorer dans la console.

Pour plus de détails sur l’utilisation de cette fonction, consultez la documentation Sklearn.

Vous allez tokeniser les textes et encoder les étiquettes en one-hot pas à pas pour comprendre comment s’opèrent les transformations.

Cet exercice fait partie du cours

Réseaux de neurones récurrents (RNN) pour la modélisation du langage avec Keras

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# See example article
print(news_dataset.____[5])
Modifier et exécuter le code