MulaiMulai sekarang secara gratis

Contoh cosine similarity

Alur cerita Animal Farm cukup sederhana. Pada awalnya, para hewan tidak puas karena harus mengikuti pemimpin manusia. Di pertengahan cerita mereka menggulingkan para pemimpin itu, dan pada akhirnya mereka kembali tidak puas terhadap hewan-hewan yang kemudian menjadi pemimpin baru mereka.

Jika diterapkan dengan benar, cosine similarity dapat membantu mengidentifikasi dokumen (bab) yang mirip satu sama lain. Dalam latihan ini, Anda akan mengidentifikasi bab-bab yang serupa di Animal Farm. Kemungkinan besar, bab 1 (awal) dan bab 10 (akhir) akan serupa.

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create word counts 
animal_farm_counts <- animal_farm %>%
  unnest_tokens(word, text_column) %>%
  ___(___) %>%
  count(chapter, word)
Edit dan Jalankan Kode