Labelvectoren voorbereiden
In de video-oefening leerde je de verschillen tussen binaire classificatie en multi-class classificatie. Je zag dat er een paar aanpassingen in de datavoorbereiding nodig zijn voordat je de modellen traint.
In deze oefening ga je een ruwe gegevensset voorbereiden met labels die als tekst zijn gegeven. De data staat in een pandas.DataFrame genaamd df met twee kolommen: text met de tekstdata en label met de labelnamen. Jouw taak is om alle benodigde transformaties op de labels toe te passen: zet strings om naar nummers en voer one-hot-encoding uit.
De module pandas als pd en de functie to_categorical() uit keras.utils.np_utils zijn al geladen in de omgeving en de eerste rijen van de gegevensset zijn op de console afgedrukt zodat je ze kunt bekijken.
Deze oefening maakt deel uit van de cursus
Recurrent Neural Networks (RNN's) voor taalmodellen met Keras
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Get the numerical ids of column label
numerical_ids = df.label.____
# Print initial shape
print(numerical_ids.____)