1. Learn
  2. /
  3. Cursuri
  4. /
  5. Ingineria caracteristicilor pentru Machine Learning în Python

Connected

exercițiu

Inspectarea valorilor Tf-idf

După crearea caracteristicilor Tf-idf, vei dori adesea să înțelegi care sunt cuvintele cu cel mai mare scor din fiecare corpus. Acest lucru se poate realiza izolând rândul pe care vrei să îl examinezi și sortând scorurile de la mare la mic.

DataFrame-ul din exercițiul anterior (tv_df) este disponibil în spațiul tău de lucru.

Instrucțiuni

100 XP
  • Atribuie primul rând din tv_df variabilei sample_row.
  • sample_row este acum o serie de ponderi atribuite cuvintelor. Sortează aceste valori pentru a afișa primele 5 cuvinte cu cel mai mare scor.