MulaiMulai sekarang secara gratis

Cocokkan semua capturing group

Dalam latihan ini, Anda akan bekerja dengan berkas teks bernama top_10 yang menyimpan nama film beserta peringkatnya. Dalam teks multi-baris ini, \\n digunakan untuk memulai baris baru. Anda akan menggunakan fungsi str_split() untuk memecah berkas teks menjadi beberapa baris.

Matriks satu baris yang baru dibuat, top_10_lines, kemudian berisi sepuluh baris dengan pola yang sama: Peringkat film, diikuti titik dan spasi, lalu judul film itu sendiri. Fungsi str_match() dan dua capturing group () akan memungkinkan Anda mengekstrak dua potongan informasi ini dari teks biasa ke dalam bentuk tabel.

Latihan ini adalah bagian dari kursus

Ekspresi Reguler Tingkat Menengah di R

Lihat Kursus

Petunjuk latihan

  • Gunakan fungsi str_split() untuk memecah teks menjadi baris-barisnya, keluarkan sebagai matriks karakter dengan mengaktifkan simplify.
  • Kenali struktur sebuah baris. Baris tersebut memuat peringkat dan judul sebuah film.
  • Ekstrak peringkat dan judul film dengan menggunakan capturing group dalam fungsi str_match().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Split the input by line break and enable simplify
top_10_lines <- str_split(
  top_10,
  pattern = "___",
  simplify = ___
)

# Inspect the first three lines and analyze their form
___[1:3]

# Add to the pattern two capturing groups that match rank and title
str_match(
  top_10_lines,
  pattern = "___\\. ___"
)
Edit dan Jalankan Kode