Menemukan kecocokan untuk salah ketik pencarian
Masukan manusia sangat rentan terhadap kesalahan. Orang sering salah ketik berbagai teks, termasuk nama atau alamat mereka, dan Anda sebagai data scientist perlu menemukan cara untuk menanganinya. Menghitung jarak string adalah salah satu cara untuk mengatasi masalah ini.
Dalam vektor kecil usernames, Anda akan menemukan tiga nama berbeda. Tugas Anda adalah menemukan nama yang paling mendekati terhadap masukan nama "Emile Brown". Dapatkah Anda menemukan nama serupa dalam vektor usernames? Gunakan amatch() untuk mencari dalam vektor tersebut dan cetak rekomendasi yang mirip seperti yang Anda lihat di Google.
Latihan ini adalah bagian dari kursus
Ekspresi Reguler Tingkat Menengah di R
Petunjuk latihan
- Tentukan jarak edit maksimum untuk fungsi
amatch()sebagai1. - Gunakan nilai hasil
amatch()yang disimpan diclosest_indexuntuk mencetak nama dalamusernames.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")
# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
x = "Emile Brown",
table = usernames,
___ = ___,
method = "lv"
)
# Print the matched name in usernames at closest_index
print(glue(
"Did you mean {name_matched}?",
name_matched = ___
))