MulaiMulai sekarang secara gratis

Apa itu tf-idf?

Anda ingin menghitung bobot tf-idf untuk kata "computer", yang muncul lima kali dalam sebuah dokumen yang berisi 100 kata. Diberikan sebuah korpus yang berisi 200 dokumen, dengan 20 dokumen menyebutkan kata "computer", tf-idf dapat dihitung dengan mengalikan frekuensi term dengan inverse document frequency.

Frekuensi term = persentase kemunculan kata dibandingkan seluruh token dalam dokumen Inverse document frequency = logaritma dari jumlah total dokumen dalam korpus dibagi jumlah dokumen yang memuat term tersebut

Manakah dari opsi di bawah ini yang benar?

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di Python

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga