NMF aplicado a los artículos de Wikipedia
En el vídeo, has visto cómo se aplicaba NMF para transformar una matriz de frecuencias de palabras de muestra. Ahora te toca aplicar NMF, esta vez utilizando la matriz de frecuencia de palabras tf-idf de los artículos de Wikipedia, dada como matriz csr articles
. Aquí, ajusta el modelo y transforma los artículos. En el siguiente ejercicio, explorarás el resultado.
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones de ejercicio
- Importa
NMF
desdesklearn.decomposition
. - Crea una instancia de
NMF
llamadamodel
con componentes de6
. - Ajusta el modelo a los datos de recuento de palabras
articles
. - Utiliza el método
.transform()
demodel
para transformararticles
, y asigna el resultado anmf_features
. - Imprime
nmf_features
para tener una primera idea de su aspecto (.round(2)
redondea las entradas a 2 decimales.)
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import NMF
____
# Create an NMF instance: model
model = ____
# Fit the model to articles
____
# Transform the articles: nmf_features
nmf_features = ____
# Print the NMF features
print(nmf_features.round(2))