Temukan kata yang umum
Misalkan Anda ingin memvisualisasikan kata-kata yang umum di berbagai dokumen. Anda dapat melakukannya dengan commonality.cloud().
Masing-masing korpus kopi dan chardonnay kita tersusun dari banyak tweet individual. Untuk memperlakukan tweet kopi sebagai satu dokumen dan demikian pula untuk chardonnay, Anda melakukan paste() pada semua tweet di setiap korpus dengan parameter collapse = " ". Ini akan menggabungkan semua tweet (dipisahkan spasi) menjadi satu vektor. Lalu Anda dapat membuat satu vektor yang berisi dua dokumen yang telah digabungkan tersebut.
a_single_string <- paste(a_character_vector, collapse = " ")
Setelah menyelesaikan langkah-langkah ini, Anda dapat menggunakan pendekatan yang sama seperti sebelumnya untuk membuat VCorpus() berdasarkan VectorSource dari objek all_tweets.
Latihan ini merupakan bagian dari kursus
Text Mining dengan Bag-of-Words di R
Instruksi latihan
- Buat
all_coffeedengan menggunakanpaste()dancollapse = " "padacoffee_tweets$text. - Buat
all_chardonnaydengan menggunakanpaste()dancollapse = " "padachardonnay_tweets$text. - Buat
all_tweetsmenggunakanc()untuk menggabungkanall_coffeedanall_chardonnay. Jadikanall_coffeesebagai elemen pertama. - Ubah
all_tweetsmenggunakanVectorSource(). - Buat
all_corpusdengan menggunakanVCorpus()padaall_tweets.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)