Apa itu tf-idf?
Anda ingin menghitung bobot tf-idf untuk kata "computer", yang muncul lima kali dalam sebuah dokumen yang berisi 100 kata. Diberikan sebuah korpus yang berisi 200 dokumen, dengan 20 dokumen menyebutkan kata "computer", tf-idf dapat dihitung dengan mengalikan frekuensi term dengan inverse document frequency.
Frekuensi term = persentase kemunculan kata dibandingkan seluruh token dalam dokumen Inverse document frequency = logaritma dari jumlah total dokumen dalam korpus dibagi jumlah dokumen yang memuat term tersebut
Manakah dari opsi di bawah ini yang benar?
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di Python
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga