Cocokkan semua capturing group
Dalam latihan ini, Anda akan bekerja dengan berkas teks bernama top_10 yang menyimpan nama film beserta peringkatnya. Dalam teks multi-baris ini, \\n digunakan untuk memulai baris baru. Anda akan menggunakan fungsi str_split() untuk memecah berkas teks menjadi beberapa baris.
Matriks satu baris yang baru dibuat, top_10_lines, kemudian berisi sepuluh baris dengan pola yang sama: Peringkat film, diikuti titik dan spasi, lalu judul film itu sendiri. Fungsi str_match() dan dua capturing group () akan memungkinkan Anda mengekstrak dua potongan informasi ini dari teks biasa ke dalam bentuk tabel.
Latihan ini adalah bagian dari kursus
Ekspresi Reguler Tingkat Menengah di R
Petunjuk latihan
- Gunakan fungsi
str_split()untuk memecah teks menjadi baris-barisnya, keluarkan sebagai matriks karakter dengan mengaktifkansimplify. - Kenali struktur sebuah baris. Baris tersebut memuat peringkat dan judul sebuah film.
- Ekstrak peringkat dan judul film dengan menggunakan capturing group dalam fungsi
str_match().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Split the input by line break and enable simplify
top_10_lines <- str_split(
top_10,
pattern = "___",
simplify = ___
)
# Inspect the first three lines and analyze their form
___[1:3]
# Add to the pattern two capturing groups that match rank and title
str_match(
top_10_lines,
pattern = "___\\. ___"
)