Tüm yakalama gruplarını eşleştir
Bu egzersizde, film adlarını ve sıralamalarını saklayan top_10 adlı bir metin dosyası ile çalışacaksın. Bu çok satırlı metinde yeni bir satıra başlamak için \\n kullanılır. Metin dosyasını birden fazla satıra ayırmak için str_split() işlevini kullanacaksın.
Yeni oluşturulan tek satırlık matris top_10_lines, aynı desene sahip on satır içerir: Filmin sırası, ardından bir nokta ve bir boşluk ve film başlığının kendisi. str_match() işlevi ve iki yakalama grubu () sayesinde bu iki bilgiyi düz metinden tabular bir forma çıkarmak mümkün olacak.
Bu egzersiz
R ile Orta Düzey Düzenli İfadeler
kursunun bir parçasıdırEgzersiz talimatları
- Metni satırlarına ayırmak için
str_split()işlevini kullan vesimplifyetkinleştirerek çıktı olarak bir karakter matrisi elde et. - Bir satırın yapısına aşina ol: Bir filmin sırası ve başlığını içerir.
str_match()işlevinde yakalama gruplarını kullanarak bir filmin sırasını ve başlığını çıkar.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Split the input by line break and enable simplify
top_10_lines <- str_split(
top_10,
pattern = "___",
simplify = ___
)
# Inspect the first three lines and analyze their form
___[1:3]
# Add to the pattern two capturing groups that match rank and title
str_match(
top_10_lines,
pattern = "___\\. ___"
)