Memeriksa nilai Tf-idf
Setelah membuat fitur Tf-idf, Anda sering kali ingin mengetahui kata-kata dengan skor tertinggi untuk setiap korpus. Ini dapat dilakukan dengan mengisolasi baris yang ingin Anda periksa lalu mengurutkan skornya dari tinggi ke rendah.
DataFrame dari latihan terakhir (tv_df) tersedia di ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk Machine Learning di Python
Petunjuk latihan
- Tetapkan baris pertama
tv_dfkesample_row. sample_rowsekarang berupa seri bobot yang ditetapkan ke kata-kata. Urutkan nilai-nilai ini untuk mencetak 5 kata dengan peringkat tertinggi.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Isolate the row to be examined
sample_row = tv_df.____
# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())