İki koşula göre eşleşme bulma
Bu egzersizde, film adları eşleşen ama yazım hataları da içeren 2 veri kümesini eşleştireceksin. İlk tablo movie_titles içinde ikinci tablo movie_db ile eşleştirmen gereken on film var. Ancak bu veriler taranmış belgelerden geldiği için Optik Karakter Tanıma yazılımının neden olduğu hatalar içeriyor.
Her iki tabloda da title ve year sütunları var. Bunları kullanarak aralarında eşleşmeleri bul.
Benzer veya aynı olan girişleri eşleştirecek 2 yardımcı fonksiyon oluştur. Biri film adları için (stringdist() tabanlı), diğeri ise yılları karşılaştırmak için abs() (farkı döndürür) kullansın.
Bu egzersiz
R ile Orta Düzey Düzenli İfadeler
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
___(left, right) < ___
}
is_string_distance_below_three("Hi there", "Hi there")