Características NMF de los artículos de Wikipedia
Ahora explorarás las características NMF que creaste en el ejercicio anterior. Se ha precargado una solución del ejercicio anterior, por lo que la matriz nmf_features
está disponible. También está disponible una lista titles
con el título de cada artículo de Wikipedia.
Al investigar las características, observa que, para ambos actores, la característica NMF 3 tiene, con diferencia, el valor más alto. Esto significa que ambos artículos se reconstruyen utilizando principalmente el tercer componente NMF. En el siguiente vídeo, verás por qué: Los componentes NMF representan temas (por ejemplo, ¡actuar!).
Este ejercicio forma parte del curso
Aprendizaje no supervisado en Python
Instrucciones del ejercicio
- Importa
pandas
comopd
. - Crea un DataFrame
df
a partir denmf_features
utilizandopd.DataFrame()
. Pon el índice entitles
utilizandoindex=titles
. - Utiliza el accesorio
.loc[]
dedf
para seleccionar la fila con título'Anne Hathaway'
, e imprime el resultado. Estas son las características NMF del artículo sobre la actriz Anne Hathaway. - Repite el último paso para
'Denzel Washington'
(otro actor).
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)