Exploración del conjunto de datos 20 News Groups
En este ejercicio, se te proporcionará una muestra del conjunto de datos 20 News Groups obtenido mediante la función fetch_20newsgroups() de sklearn.datasets, filtrando solo tres clases: sci.space, alt.atheism y soc.religion.christian.
El conjunto de datos se carga en la variable news_dataset. Sus atributos están impresos para que puedas explorarlos en la consola.
Para obtener más información sobre cómo utilizar esta función, consulta la documentación de Sklearn.
Tokenizarás los textos y codificarás las etiquetas paso a paso con codificación one-hot para comprender cómo se producen las transformaciones.
Este ejercicio forma parte del curso
Redes neuronales recurrentes (RNN) para el modelado del lenguaje con Keras
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# See example article
print(news_dataset.____[5])