Ortak sözcükleri bul

Diyelim ki birden fazla belge arasında ortak sözcükleri görselleştirmek istiyorsun. Bunu commonality.cloud() ile yapabilirsin.

Kahve ve chardonnay derlemlerimizin her biri birçok ayrı tweetten oluşuyor. Kahve tweet'lerini tek bir belge (ve chardonnay için de aynı şekilde) olarak ele almak için, her derlemedeki tüm tweet'leri collapse = " " parametresiyle birlikte paste() ile bir araya getirirsin. Bu, tüm tweet'leri (aralarında bir boşluk olacak şekilde) tek bir vektörde toplar. Ardından iki birleştirilmiş belgeyi içeren tek bir vektör oluşturabilirsin.

a_single_string <- paste(a_character_vector, collapse = " ")

Bu adımları tamamladıktan sonra, daha önce gördüğün yaklaşımla all_tweets nesnesinden bir VectorSource temel alan VCorpus() oluşturabilirsin.

Bu egzersiz, kursun bir parçasıdır

R ile Bag-of-Words ile Metin Madenciliği

Kursa Göz Atın

Egzersiz talimatları

coffee_tweets$text üzerinde collapse = " " ile paste() kullanarak all_coffee oluştur.
chardonnay_tweets$text üzerinde collapse = " " ile paste() kullanarak all_chardonnay oluştur.
all_coffee ve all_chardonnay'ı birleştirmek için c() kullanarak all_tweets oluştur. İlk terim all_coffee olsun.
all_tweets'i VectorSource() kullanarak dönüştür.
all_tweets üzerinde VCorpus() kullanarak all_corpus oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create all_coffee
___ <- ___(___, ___)

# Create all_chardonnay
___ <- ___(___, ___)

# Create all_tweets
___ <- ___(___, ___)

# Convert to a vector source
___ <- ___(___)

# Create all_corpus
___ <- ___(___)

Kodu Düzenle ve Çalıştır