Inspecionando valores de Tf-idf
Depois de criar recursos de Tf-idf, muitas vezes você vai querer entender quais são as palavras com as maiores pontuações em cada corpus. Isso pode ser feito isolando a linha que você quer examinar e, em seguida, ordenando as pontuações da maior para a menor.
O DataFrame do último exercício (tv_df) está disponível no seu workspace.
Este exercício faz parte do curso
Feature Engineering for Machine Learning in Python
Instruções do exercício
- Atribua a primeira linha de
tv_dfasample_row. sample_rowagora é uma série de pesos atribuídos às palavras. Ordene esses valores para imprimir as 5 palavras com maior pontuação.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Isolate the row to be examined
sample_row = tv_df.____
# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())