ComeçarComece de graça

NMF recursos dos artigos da Wikipédia

Agora você explorará os recursos do NMF que criou no exercício anterior. Uma solução para o exercício anterior foi pré-carregada, portanto, a matriz nmf_features está disponível. Também está disponível uma lista titles com o título de cada artigo da Wikipédia.

Ao investigar os recursos, observe que, para ambos os atores, o recurso 3 do NMF tem, de longe, o valor mais alto. Isso significa que ambos os artigos são reconstruídos usando principalmente o terceiro componente NMF. No próximo vídeo, você verá o porquê: os componentes do NMF representam tópicos (por exemplo, atuação!).

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Importe pandas como pd.
  • Crie um DataFrame df a partir de nmf_features usando pd.DataFrame(). Defina o índice para titles usando index=titles.
  • Use o acessor .loc[] de df para selecionar a linha com o título 'Anne Hathaway' e imprima o resultado. Estes são os recursos do site NMF para o artigo sobre a atriz Anne Hathaway.
  • Repita a última etapa para 'Denzel Washington' (outro ator).

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import pandas
____

# Create a pandas DataFrame: df
df = ____

# Print the row for 'Anne Hathaway'
print(____)

# Print the row for 'Denzel Washington'
print(____)
Editar e executar o código