Características NMF dos artigos da Wikipedia
Agora você vai dar uma olhada nas funcionalidades do NMF que criou no exercício anterior. A solução do exercício anterior já está pronta, então a matriz nmf_features
está disponível. Também tem uma lista titles
com o título de cada artigo da Wikipedia.
Quando você estiver olhando as características, repara que, para os dois atores, a característica NMF 3 tem, de longe, o valor mais alto. Isso quer dizer que os dois artigos são reconstruídos usando principalmente o terceiro componente NMF. No próximo vídeo, você vai entender o porquê: Os componentes NMF são tipo tópicos (por exemplo, atuação!).
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
pandas
comopd
. - Crie um DataFrame chamado “
df
” a partir de “nmf_features
” usando “pd.DataFrame()
”. Defina o índice como “titles
” usando “index=titles
”. - Use o acessor
.loc[]
dedf
para escolher a linha com o título'Anne Hathaway'
e imprima o resultado. Essas são as características NMF do artigo sobre a atriz Anne Hathaway. - Repete o último passo para
'Denzel Washington'
(outro ator).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)