Temukan kata yang umum

Misalkan Anda ingin memvisualisasikan kata-kata yang umum di berbagai dokumen. Anda dapat melakukannya dengan commonality.cloud().

Masing-masing korpus kopi dan chardonnay kita tersusun dari banyak tweet individual. Untuk memperlakukan tweet kopi sebagai satu dokumen dan demikian pula untuk chardonnay, Anda melakukan paste() pada semua tweet di setiap korpus dengan parameter collapse = " ". Ini akan menggabungkan semua tweet (dipisahkan spasi) menjadi satu vektor. Lalu Anda dapat membuat satu vektor yang berisi dua dokumen yang telah digabungkan tersebut.

a_single_string <- paste(a_character_vector, collapse = " ")

Setelah menyelesaikan langkah-langkah ini, Anda dapat menggunakan pendekatan yang sama seperti sebelumnya untuk membuat VCorpus() berdasarkan VectorSource dari objek all_tweets.

Latihan ini merupakan bagian dari kursus

Text Mining dengan Bag-of-Words di R

Lihat Kursus

Instruksi latihan

Buat all_coffee dengan menggunakan paste() dan collapse = " " pada coffee_tweets$text.
Buat all_chardonnay dengan menggunakan paste() dan collapse = " " pada chardonnay_tweets$text.
Buat all_tweets menggunakan c() untuk menggabungkan all_coffee dan all_chardonnay. Jadikan all_coffee sebagai elemen pertama.
Ubah all_tweets menggunakan VectorSource().
Buat all_corpus dengan menggunakan VCorpus() pada all_tweets.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)

Edit dan Jalankan Kode