1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Rekurentní neuronové sítě (RNN) pro jazykové modelování s Keras

Connected

cvičení

Průzkum datasetu 20 News Groups

V tomto cvičení dostaneš ukázku z datasetu 20 News Groups získanou pomocí funkce fetch_20newsgroups() z knihovny sklearn.datasets, filtrované pouze pro tři třídy: sci.space, alt.atheism a soc.religion.christian.

Dataset je načtený do proměnné news_dataset. Jeho atributy jsou vypsány v konzoli, abys je mohl/a prozkoumat.

Víc podrobností o použití této funkce najdeš v dokumentaci Sklearn.

Texty tokenizuješ a labely zakóduješ pomocí one-hot encodingu krok po kroku, aby sis lépe uvědomil/a, jak jednotlivé transformace probíhají.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vypiš ukázkový článek s indexem 5 z news_dataset.data.