Ortak sözcükleri bul
Diyelim ki birden fazla belge arasında ortak sözcükleri görselleştirmek istiyorsun. Bunu commonality.cloud() ile yapabilirsin.
Kahve ve chardonnay derlemlerimizin her biri birçok ayrı tweetten oluşuyor. Kahve tweet'lerini tek bir belge (ve chardonnay için de aynı şekilde) olarak ele almak için, her derlemedeki tüm tweet'leri collapse = " " parametresiyle birlikte paste() ile bir araya getirirsin. Bu, tüm tweet'leri (aralarında bir boşluk olacak şekilde) tek bir vektörde toplar. Ardından iki birleştirilmiş belgeyi içeren tek bir vektör oluşturabilirsin.
a_single_string <- paste(a_character_vector, collapse = " ")
Bu adımları tamamladıktan sonra, daha önce gördüğün yaklaşımla all_tweets nesnesinden bir VectorSource temel alan VCorpus() oluşturabilirsin.
Bu egzersiz
R ile Bag-of-Words ile Metin Madenciliği
kursunun bir parçasıdırEgzersiz talimatları
coffee_tweets$textüzerindecollapse = " "ilepaste()kullanarakall_coffeeoluştur.chardonnay_tweets$textüzerindecollapse = " "ilepaste()kullanarakall_chardonnayoluştur.all_coffeeveall_chardonnay'ı birleştirmek içinc()kullanarakall_tweetsoluştur. İlk terimall_coffeeolsun.all_tweets'iVectorSource()kullanarak dönüştür.all_tweetsüzerindeVCorpus()kullanarakall_corpusoluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create all_coffee
___ <- ___(___, ___)
# Create all_chardonnay
___ <- ___(___, ___)
# Create all_tweets
___ <- ___(___, ___)
# Convert to a vector source
___ <- ___(___)
# Create all_corpus
___ <- ___(___)