Tf-idf-waarden inspecteren
Nadat je Tf-idf-features hebt gemaakt, wil je vaak weten welke woorden per corpus de hoogste score hebben. Dit kun je doen door de rij die je wilt bekijken te isoleren en vervolgens de scores van hoog naar laag te sorteren.
De DataFrame uit de vorige oefening (tv_df) is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Feature engineering voor Machine Learning in Python
Oefeninstructies
- Wijs de eerste rij van
tv_dftoe aansample_row. sample_rowis nu een reeks gewichten die aan woorden zijn toegekend. Sorteer deze waarden om de 5 hoogst scorende woorden te printen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Isolate the row to be examined
sample_row = tv_df.____
# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())