MulaiMulai sekarang secara gratis

Menemukan kecocokan berdasarkan dua kondisi

Dalam latihan ini, Anda akan mencocokkan 2 himpunan data dengan judul film yang bersesuaian, tetapi juga mengandung salah ketik. Pada tabel pertama movie_titles, terdapat sepuluh film yang harus Anda cocokkan dengan tabel kedua movie_db. Namun, data tersebut berasal dari dokumen yang dipindai dan mengandung kesalahan dari perangkat lunak Optical Character Recognition.

Kedua tabel berisi kolom title dan year. Gunakan kolom-kolom ini untuk menemukan kecocokan di antara keduanya.

Buat 2 fungsi pembantu yang mencocokkan entri yang mirip atau sama. Satu untuk judul film (berdasarkan stringdist()) dan satu lagi untuk membandingkan tahun, menggunakan abs() (yang mengembalikan selisih/delta).

Latihan ini adalah bagian dari kursus

Ekspresi Reguler Tingkat Menengah di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate the string distance - it should be smaller than 3
is_string_distance_below_three <- function(left, right) {
  ___(left, right) < ___
}

is_string_distance_below_three("Hi there", "Hi there")
Edit dan Jalankan Kode