Etikettenvektoren vorbereiten
In der Videoübung hast du die Unterschiede zwischen binärer Klassifizierung und Mehrklassenklassifizierung gelernt. Du hast gelernt, dass vor dem Training der Modelle ein paar Änderungen am Datenvorbereitungsprozess gemacht werden müssen.
In dieser Übung machst du einen Rohdatensatz mit Beschriftungen als Text fertig. Die Daten sind als „ pandas.DataFrame “ mit dem Namen „ df “ gespeichert und haben zwei Spalten: „ text “ mit den Textdaten und „ label “ mit den Labelnamen. Deine Aufgabe ist es, alle notwendigen Änderungen an den Labels vorzunehmen: Wandle Zeichenfolgen in Zahlen um und führe eine One-Hot-Kodierung durch.
Das Modul „ pandas “ als „ pd “ und die Funktion „ to_categorical() “ aus „ keras.utils.np_utils “ sind schon in der Umgebung geladen und die ersten Zeilen des Datensatzes werden auf der Konsole angezeigt, damit du sie sehen kannst.
Diese Übung ist Teil des Kurses
Rekursive neuronale Netze (RNNs) für die Sprachmodellierung mit Keras
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Get the numerical ids of column label
numerical_ids = df.label.____
# Print initial shape
print(numerical_ids.____)