MulaiMulai sekarang secara gratis

Visualisasikan kata umum

Sekarang setelah Anda memiliki korpus yang berisi kata-kata yang digunakan pada kedua berkas tweet chardonnay dan coffee, Anda dapat membersihkan korpus, mengonversinya menjadi TermDocumentMatrix, lalu menjadi matriks untuk menyiapkannya bagi commonality.cloud().

Fungsi commonality.cloud() menerima objek matriks ini, beserta argumen tambahan seperti max.words dan colors untuk menyesuaikan plot lebih lanjut.

commonality.cloud(tdm_matrix, max.words = 100, colors = "springgreen")

Latihan ini adalah bagian dari kursus

Text Mining dengan Bag-of-Words di R

Lihat Kursus

Petunjuk latihan

  • Buat all_clean dengan menerapkan fungsi clean_corpus() yang telah disediakan pada all_corpus.
  • Buat all_tdm, sebuah TermDocumentMatrix dari all_clean.
  • Buat all_m dengan mengonversi all_tdm menjadi objek matriks.
  • Buat commonality.cloud() dari all_m dengan max.words = 100 dan colors = "steelblue1".

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Clean the corpus
___ <- ___(___)

# Create all_tdm
___ <- ___(___)

# Create all_m
___ <- ___(___)

# Print a commonality cloud
___(___, ___, ___)
Edit dan Jalankan Kode