Jika Anda tidak tahu apa yang Anda cari
Sejauh ini Anda telah menggunakan str_detect() yang mengembalikan TRUE jika pola cocok dan FALSE jika tidak. Namun, regular expression juga sangat andal untuk mengekstrak istilah yang dicari dari teks yang lebih besar. Anda dapat menggunakan fungsi str_match() untuk itu.
Karakter khusus berikutnya yang akan Anda kenali adalah titik: ".". Titik mencocokkan karakter apa pun; ini seperti kartu liar. Jadi jika Anda mencari misalnya "..." Anda akan menemukan tiga karakter—baik huruf, angka, maupun spasi.
Ini sangat praktis, kecuali jika Anda perlu mencari tanda titik sebenarnya ".". Dalam kasus tersebut: escape tanda titik dengan dua backslash: "\\."
Latihan ini adalah bagian dari kursus
Ekspresi Reguler Tingkat Menengah di R
Petunjuk latihan
- Cocokkan bukan hanya
Saw 4tetapi juga sekuel lainnya. - Cocokkan empat karakter pertama dari semua judul film yang dimulai dengan
"K". - Deteksi film yang diakhiri dengan tanda titik sebenarnya
".".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Here's an example pattern that will find the movie Saw 4
str_match(movie_titles, pattern = "Saw 4")
# Match all sequels of the movie "Saw"
str_match(movie_titles, pattern = "___")
# Match the letter K and three arbitrary characters
str_match(movie_titles, pattern = "^K___")
# Detect whether the movie titles end with a full stop
str_detect(movie_titles, pattern = "___$")