NMF recursos dos artigos da Wikipédia
Agora você explorará os recursos do NMF que criou no exercício anterior. Uma solução para o exercício anterior foi pré-carregada, portanto, a matriz nmf_features está disponível. Também está disponível uma lista titles com o título de cada artigo da Wikipédia.
Ao investigar os recursos, observe que, para ambos os atores, o recurso 3 do NMF tem, de longe, o valor mais alto. Isso significa que ambos os artigos são reconstruídos usando principalmente o terceiro componente NMF. No próximo vídeo, você verá o porquê: os componentes do NMF representam tópicos (por exemplo, atuação!).
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
pandascomopd. - Crie um DataFrame
dfa partir denmf_featuresusandopd.DataFrame(). Defina o índice paratitlesusandoindex=titles. - Use o acessor
.loc[]dedfpara selecionar a linha com o título'Anne Hathaway'e imprima o resultado. Estes são os recursos do site NMF para o artigo sobre a atriz Anne Hathaway. - Repita a última etapa para
'Denzel Washington'(outro ator).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
____
# Create a pandas DataFrame: df
df = ____
# Print the row for 'Anne Hathaway'
print(____)
# Print the row for 'Denzel Washington'
print(____)