1. Nauka
  2. /
  3. Kursy
  4. /
  5. Rekurencyjne sieci neuronowe (RNN) do modelowania języka w Keras

Connected

ćwiczenie

Przygotowanie wektorów etykiet

W lekcji wideo poznałeś różnice między klasyfikacją binarną a klasyfikacją wieloklasową. Dowiedziałeś się, że przed trenowaniem modeli należy wprowadzić pewne modyfikacje w procesie przygotowania danych.

W tym ćwiczeniu przygotujesz nieprzetworzony zbiór danych z etykietami podanymi jako tekst. Dane są zapisane w obiekcie pandas.DataFrame o nazwie df, zawierającym dwie kolumny: text z danymi tekstowymi oraz label z nazwami etykiet. Twoim zadaniem jest wykonanie wszystkich niezbędnych przekształceń etykiet: zamiana ciągów znaków na liczby oraz kodowanie "one-hot".

Moduł pandas jako pd oraz funkcja to_categorical() z keras.utils.np_utils są już załadowane w środowisku, a pierwsze wiersze zbioru danych są wyświetlane w konsoli.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Pobierz atrybut .cat.codes kolumny label z ramki danych df i wyświetl jej kształt.