Aan de slagGa gratis aan de slag

Tf-idf-waarden inspecteren

Nadat je Tf-idf-features hebt gemaakt, wil je vaak weten welke woorden per corpus de hoogste score hebben. Dit kun je doen door de rij die je wilt bekijken te isoleren en vervolgens de scores van hoog naar laag te sorteren.

De DataFrame uit de vorige oefening (tv_df) is beschikbaar in je werkruimte.

Deze oefening maakt deel uit van de cursus

Feature engineering voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Wijs de eerste rij van tv_df toe aan sample_row.
  • sample_row is nu een reeks gewichten die aan woorden zijn toegekend. Sorteer deze waarden om de 5 hoogst scorende woorden te printen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Isolate the row to be examined
sample_row = tv_df.____

# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())
Code bewerken en uitvoeren