MulaiMulai sekarang secara gratis

Temukan kata yang umum

Misalkan Anda ingin memvisualisasikan kata-kata yang umum di berbagai dokumen. Anda dapat melakukannya dengan commonality.cloud().

Masing-masing korpus kopi dan chardonnay kita tersusun dari banyak tweet individual. Untuk memperlakukan tweet kopi sebagai satu dokumen dan demikian pula untuk chardonnay, Anda melakukan paste() pada semua tweet di setiap korpus dengan parameter collapse = " ". Ini akan menggabungkan semua tweet (dipisahkan spasi) menjadi satu vektor. Lalu Anda dapat membuat satu vektor yang berisi dua dokumen yang telah digabungkan tersebut.

a_single_string <- paste(a_character_vector, collapse = " ")

Setelah menyelesaikan langkah-langkah ini, Anda dapat menggunakan pendekatan yang sama seperti sebelumnya untuk membuat VCorpus() berdasarkan VectorSource dari objek all_tweets.

Latihan ini adalah bagian dari kursus

Text Mining dengan Bag-of-Words di R

Lihat Kursus

Petunjuk latihan

  • Buat all_coffee dengan menggunakan paste() dan collapse = " " pada coffee_tweets$text.
  • Buat all_chardonnay dengan menggunakan paste() dan collapse = " " pada chardonnay_tweets$text.
  • Buat all_tweets menggunakan c() untuk menggabungkan all_coffee dan all_chardonnay. Jadikan all_coffee sebagai elemen pertama.
  • Ubah all_tweets menggunakan VectorSource().
  • Buat all_corpus dengan menggunakan VCorpus() pada all_tweets.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)
Edit dan Jalankan Kode