ComeçarComece de graça

Inspecionando valores de Tf-idf

Depois de criar recursos de Tf-idf, muitas vezes você vai querer entender quais são as palavras com as maiores pontuações em cada corpus. Isso pode ser feito isolando a linha que você quer examinar e, em seguida, ordenando as pontuações da maior para a menor.

O DataFrame do último exercício (tv_df) está disponível no seu workspace.

Este exercício faz parte do curso

Feature Engineering for Machine Learning in Python

Ver curso

Instruções do exercício

  • Atribua a primeira linha de tv_df a sample_row.
  • sample_row agora é uma série de pesos atribuídos às palavras. Ordene esses valores para imprimir as 5 palavras com maior pontuação.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Isolate the row to be examined
sample_row = tv_df.____

# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())
Editar e executar o código