Datensatz „20 News Groups“ erkunden
In dieser Übung bekommst du einen Ausschnitt aus dem Datensatz „20 News Groups“, den du mit der Funktion „ fetch_20newsgroups() “ von sklearn.datasets bekommen hast. Dabei wurden nur drei Klassen herausgefiltert: „ sci.space “, „ alt.atheism “ und „ soc.religion.christian “.
Der Datensatz wird in die Variable „ news_dataset “ geladen. Seine Eigenschaften werden angezeigt, sodass du sie in der Konsole checken kannst.
Mehr Infos zur Verwendung dieser Funktion findest du in der Sklearn-Dokumentation.
Du wirst die Texte tokenisieren und die Labels Schritt für Schritt One-Hot-codieren, um zu verstehen, wie die Transformationen ablaufen.
Diese Übung ist Teil des Kurses
Rekursive neuronale Netze (RNNs) für die Sprachmodellierung mit Keras
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# See example article
print(news_dataset.____[5])