Menemukan kecocokan untuk salah ketik pencarian
Masukan manusia sangat rentan terhadap kesalahan. Orang sering salah ketik berbagai teks, termasuk nama atau alamat mereka, dan Anda sebagai data scientist perlu menemukan cara untuk menanganinya. Menghitung jarak string adalah salah satu cara untuk mengatasi masalah ini.
Dalam vektor kecil usernames, Anda akan menemukan tiga nama berbeda. Tugas Anda adalah menemukan nama yang paling mendekati terhadap masukan nama "Emile Brown". Dapatkah Anda menemukan nama serupa dalam vektor usernames? Gunakan amatch() untuk mencari dalam vektor tersebut dan cetak rekomendasi yang mirip seperti yang Anda lihat di Google.
Latihan ini merupakan bagian dari kursus
Ekspresi Reguler Tingkat Menengah di R
Instruksi latihan
- Tentukan jarak edit maksimum untuk fungsi
amatch()sebagai1. - Gunakan nilai hasil
amatch()yang disimpan diclosest_indexuntuk mencetak nama dalamusernames.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")
# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
x = "Emile Brown",
table = usernames,
___ = ___,
method = "lv"
)
# Print the matched name in usernames at closest_index
print(glue(
"Did you mean {name_matched}?",
name_matched = ___
))