Temukan kata yang umum
Misalkan Anda ingin memvisualisasikan kata-kata yang umum di berbagai dokumen. Anda dapat melakukannya dengan commonality.cloud().
Masing-masing korpus kopi dan chardonnay kita tersusun dari banyak tweet individual. Untuk memperlakukan tweet kopi sebagai satu dokumen dan demikian pula untuk chardonnay, Anda melakukan paste() pada semua tweet di setiap korpus dengan parameter collapse = " ". Ini akan menggabungkan semua tweet (dipisahkan spasi) menjadi satu vektor. Lalu Anda dapat membuat satu vektor yang berisi dua dokumen yang telah digabungkan tersebut.
a_single_string <- paste(a_character_vector, collapse = " ")
Setelah menyelesaikan langkah-langkah ini, Anda dapat menggunakan pendekatan yang sama seperti sebelumnya untuk membuat VCorpus() berdasarkan VectorSource dari objek all_tweets.
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Petunjuk latihan
- Buat
all_coffeedengan menggunakanpaste()dancollapse = " "padacoffee_tweets$text. - Buat
all_chardonnaydengan menggunakanpaste()dancollapse = " "padachardonnay_tweets$text. - Buat
all_tweetsmenggunakanc()untuk menggabungkanall_coffeedanall_chardonnay. Jadikanall_coffeesebagai elemen pertama. - Ubah
all_tweetsmenggunakanVectorSource(). - Buat
all_corpusdengan menggunakanVCorpus()padaall_tweets.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)