ComenzarEmpieza gratis

Características NMF de los artículos de Wikipedia

Ahora vas a explorar las características NMF que creaste en el ejercicio anterior. Se ha precargado una solución del ejercicio anterior, por lo que la matriz nmf_features está disponible. También está disponible una lista titles con el título de cada artículo de Wikipedia.

Al analizar las características, fíjate en que, para ambos actores, la característica 3 del NMF es, con diferencia, la que tiene el valor más alto. Esto significa que ambos artículos se reconstruyen utilizando principalmente el tercer componente NMF. En el siguiente vídeo, verás por qué: Los componentes del NMF representan temas (¡como, por ejemplo, la interpretación!).

Este ejercicio forma parte del curso

Aprendizaje no supervisado en Python

Ver curso

Instrucciones del ejercicio

  • Importa pandas como pd.
  • Crea un DataFrame df a partir de nmf_features utilizando pd.DataFrame(). Pon el índice en titles utilizando index=titles.
  • Utiliza el accesorio .loc[] de df para seleccionar la fila con título 'Anne Hathaway', e imprime el resultado. Estas son las características de NMF para el artículo sobre la actriz Anne Hathaway.
  • Repite el último paso para 'Denzel Washington' (otro actor).

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Editar y ejecutar código