Apa itu tf-idf?
Anda ingin menghitung bobot tf-idf untuk kata "computer", yang muncul lima kali dalam sebuah dokumen yang berisi 100 kata. Diberikan sebuah korpus yang berisi 200 dokumen, dengan 20 dokumen menyebutkan kata "computer", tf-idf dapat dihitung dengan mengalikan frekuensi term dengan inverse document frequency.
Frekuensi term = persentase kemunculan kata dibandingkan seluruh token dalam dokumen Inverse document frequency = logaritma dari jumlah total dokumen dalam korpus dibagi jumlah dokumen yang memuat term tersebut
Manakah dari opsi di bawah ini yang benar?
Latihan ini merupakan bagian dari kursus
Pengantar Natural Language Processing di Python
Latihan interaktif langsung
Ubah teori menjadi aksi dengan salah satu latihan interaktif kami
Mulai latihan