Explorando o conjunto de dados 20 News Groups
Neste exercício, você vai receber uma amostra do conjunto de dados 20 News Groups, que foi obtido usando a função fetch_20newsgroups() do site sklearn.datasets, filtrando só três classes: sci.space, alt.atheism e soc.religion.christian.
O conjunto de dados é carregado na variável news_dataset. Os atributos dele estão impressos para você dar uma olhada no console.
Para mais detalhes sobre como usar essa função, dá uma olhada na documentação do Sklearn.
Você vai tokenizar os textos e codificar os rótulos com one-hot passo a passo pra entender como as transformações acontecem.
Este exercício faz parte do curso
Redes Neurais Recorrentes (RNNs) para Modelagem de Linguagem com Keras
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# See example article
print(news_dataset.____[5])