Contoh cosine similarity
Alur cerita Animal Farm cukup sederhana. Pada awalnya, para hewan tidak puas karena harus mengikuti pemimpin manusia. Di pertengahan cerita mereka menggulingkan para pemimpin itu, dan pada akhirnya mereka kembali tidak puas terhadap hewan-hewan yang kemudian menjadi pemimpin baru mereka.
Jika diterapkan dengan benar, cosine similarity dapat membantu mengidentifikasi dokumen (bab) yang mirip satu sama lain. Dalam latihan ini, Anda akan mengidentifikasi bab-bab yang serupa di Animal Farm. Kemungkinan besar, bab 1 (awal) dan bab 10 (akhir) akan serupa.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create word counts
animal_farm_counts <- animal_farm %>%
unnest_tokens(word, text_column) %>%
___(___) %>%
count(chapter, word)