MulaiMulai sekarang secara gratis

Menggunakan "or pattern" dengan himpunan data yang lebih besar

Sekarang setelah Anda memahami prinsip menggabungkan beberapa kemungkinan dari sebuah vektor, Anda akan melangkah lebih jauh dan menerapkannya pada himpunan data yang lebih besar. Tersedia di lingkup global dua variabel: articles dan politicians. Yang pertama adalah kumpulan artikel berita tentang politik Swiss. Yang kedua adalah daftar nama politisi Swiss yang muncul dalam artikel-artikel tersebut.

Sekarang tugas Anda adalah mengetahui nama mana yang muncul di artikel mana, dan politisi mana yang muncul berapa kali di seluruh artikel.

Latihan ini adalah bagian dari kursus

Ekspresi Reguler Tingkat Menengah di R

Lihat Kursus

Petunjuk latihan

  • Gunakan vektor politicians untuk membuat regular expression yang mencocokkan semua nama yang tersimpan dalam vektor tersebut.
  • Buat kolom baru di data frame articles yang berisi semua nama politisi yang muncul di kolom text.
  • Gabungkan semua artikel agar Anda dapat lebih mudah menghitung jumlah kemunculan per politisi.
  • Gunakan vektor politicians sebagai pola dan teruskan ke str_count().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")

# Use the pattern to match all names in the column "text"
articles %<>%
  mutate(mentions = str_match_all(___, ___))

# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)

# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)
Edit dan Jalankan Kode