Esaminare i valori Tf-idf
Dopo aver creato le caratteristiche Tf-idf, spesso vorrai capire quali sono le parole con il punteggio più alto per ciascun corpus. Questo si può fare isolando la riga che vuoi analizzare e poi ordinando i punteggi dal più alto al più basso.
Il DataFrame dell’esercizio precedente (tv_df) è disponibile nel tuo workspace.
Questo esercizio fa parte del corso
Feature Engineering per il Machine Learning in Python
Istruzioni dell'esercizio
- Assegna la prima riga di
tv_dfasample_row. sample_rowè ora una serie di pesi associati alle parole. Ordina questi valori per stampare le 5 parole con punteggio più alto.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Isolate the row to be examined
sample_row = tv_df.____
# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())