Menggunakan "or pattern" dengan himpunan data yang lebih besar
Sekarang setelah Anda memahami prinsip menggabungkan beberapa kemungkinan dari sebuah vektor, Anda akan melangkah lebih jauh dan menerapkannya pada himpunan data yang lebih besar. Tersedia di lingkup global dua variabel: articles dan politicians. Yang pertama adalah kumpulan artikel berita tentang politik Swiss. Yang kedua adalah daftar nama politisi Swiss yang muncul dalam artikel-artikel tersebut.
Sekarang tugas Anda adalah mengetahui nama mana yang muncul di artikel mana, dan politisi mana yang muncul berapa kali di seluruh artikel.
Latihan ini adalah bagian dari kursus
Ekspresi Reguler Tingkat Menengah di R
Petunjuk latihan
- Gunakan vektor
politiciansuntuk membuat regular expression yang mencocokkan semua nama yang tersimpan dalam vektor tersebut. - Buat kolom baru di data frame
articlesyang berisi semua nama politisi yang muncul di kolomtext. - Gabungkan semua artikel agar Anda dapat lebih mudah menghitung jumlah kemunculan per politisi.
- Gunakan vektor
politicianssebagai pola dan teruskan kestr_count().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Construct a pattern that searches for all politicians
polit_pattern <- glue_collapse(___, sep = "___")
# Use the pattern to match all names in the column "text"
articles %<>%
mutate(mentions = str_match_all(___, ___))
# Collapse all items of the column "text"
all_articles_in_one <- ___(articles$text)
# Pass the vector politicians to count all its elements
str_count(all_articles_in_one, ___)