CommencerCommencer gratuitement

Examiner les valeurs Tf-idf

Après avoir créé des caractéristiques Tf-idf, vous souhaiterez souvent identifier les mots qui obtiennent les scores les plus élevés pour chaque corpus. Pour cela, isolez la ligne que vous voulez analyser, puis triez les scores du plus élevé au plus faible.

Le DataFrame de l’exercice précédent (tv_df) est disponible dans votre espace de travail.

Cet exercice fait partie du cours

Feature engineering pour le Machine Learning en Python

Afficher le cours

Instructions

  • Affectez la première ligne de tv_df à sample_row.
  • sample_row est maintenant une série de poids associés aux mots. Triez ces valeurs pour afficher les 5 mots les mieux notés.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Isolate the row to be examined
sample_row = tv_df.____

# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())
Modifier et exécuter le code