Menemukan kecocokan berdasarkan dua kondisi
Dalam latihan ini, Anda akan mencocokkan 2 himpunan data dengan judul film yang bersesuaian, tetapi juga mengandung salah ketik. Pada tabel pertama movie_titles, terdapat sepuluh film yang harus Anda cocokkan dengan tabel kedua movie_db. Namun, data tersebut berasal dari dokumen yang dipindai dan mengandung kesalahan dari perangkat lunak Optical Character Recognition.
Kedua tabel berisi kolom title dan year. Gunakan kolom-kolom ini untuk menemukan kecocokan di antara keduanya.
Buat 2 fungsi pembantu yang mencocokkan entri yang mirip atau sama. Satu untuk judul film (berdasarkan stringdist()) dan satu lagi untuk membandingkan tahun, menggunakan abs() (yang mengembalikan selisih/delta).
Latihan ini adalah bagian dari kursus
Ekspresi Reguler Tingkat Menengah di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
___(left, right) < ___
}
is_string_distance_below_three("Hi there", "Hi there")