ComenzarEmpieza gratis

Características NMF de los artículos de Wikipedia

Ahora explorarás las características NMF que creaste en el ejercicio anterior. Se ha precargado una solución del ejercicio anterior, por lo que la matriz nmf_features está disponible. También está disponible una lista titles con el título de cada artículo de Wikipedia.

Al investigar las características, observa que, para ambos actores, la característica NMF 3 tiene, con diferencia, el valor más alto. Esto significa que ambos artículos se reconstruyen utilizando principalmente el tercer componente NMF. En el siguiente vídeo, verás por qué: Los componentes NMF representan temas (por ejemplo, ¡actuar!).

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones del ejercicio

  • Importa pandas como pd.
  • Crea un DataFrame df a partir de nmf_features utilizando pd.DataFrame(). Pon el índice en titles utilizando index=titles.
  • Utiliza el accesorio .loc[] de df para seleccionar la fila con título 'Anne Hathaway', e imprime el resultado. Estas son las características NMF del artículo sobre la actriz Anne Hathaway.
  • Repite el último paso para 'Denzel Washington' (otro actor).

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Editar y ejecutar código