Mulai sekarangMulai gratis

Menggunakan "or pattern" dengan himpunan data yang lebih besar

Sekarang setelah Anda memahami prinsip menggabungkan beberapa kemungkinan dari sebuah vektor, Anda akan melangkah lebih jauh dan menerapkannya pada himpunan data yang lebih besar. Tersedia di lingkup global dua variabel: articles dan politicians. Yang pertama adalah kumpulan artikel berita tentang politik Swiss. Yang kedua adalah daftar nama politisi Swiss yang muncul dalam artikel-artikel tersebut.

Sekarang tugas Anda adalah mengetahui nama mana yang muncul di artikel mana, dan politisi mana yang muncul berapa kali di seluruh artikel.

Latihan ini merupakan bagian dari kursus

Ekspresi Reguler Tingkat Menengah di R

Lihat Kursus

Instruksi latihan

  • Gunakan vektor politicians untuk membuat regular expression yang mencocokkan semua nama yang tersimpan dalam vektor tersebut.
  • Buat kolom baru di data frame articles yang berisi semua nama politisi yang muncul di kolom text.
  • Gabungkan semua artikel agar Anda dapat lebih mudah menghitung jumlah kemunculan per politisi.
  • Gunakan vektor politicians sebagai pola dan teruskan ke str_count().

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")

# Use the pattern to match all names in the column "text"
articles %<>%
  mutate(mentions = str_match_all(___, ___))

# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)

# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)
Edit dan Jalankan Kode