Menemukan kecocokan untuk salah ketik pencarian

Masukan manusia sangat rentan terhadap kesalahan. Orang sering salah ketik berbagai teks, termasuk nama atau alamat mereka, dan Anda sebagai data scientist perlu menemukan cara untuk menanganinya. Menghitung jarak string adalah salah satu cara untuk mengatasi masalah ini.

Dalam vektor kecil usernames, Anda akan menemukan tiga nama berbeda. Tugas Anda adalah menemukan nama yang paling mendekati terhadap masukan nama "Emile Brown". Dapatkah Anda menemukan nama serupa dalam vektor usernames? Gunakan amatch() untuk mencari dalam vektor tersebut dan cetak rekomendasi yang mirip seperti yang Anda lihat di Google.

Latihan ini merupakan bagian dari kursus

Ekspresi Reguler Tingkat Menengah di R

Lihat Kursus

Instruksi latihan

Tentukan jarak edit maksimum untuk fungsi amatch() sebagai 1.
Gunakan nilai hasil amatch() yang disimpan di closest_index untuk mencetak nama dalam usernames.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")

# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
  x = "Emile Brown",
  table = usernames,
  ___ = ___,
  method = "lv"
)

# Print the matched name in usernames at closest_index
print(glue(
  "Did you mean {name_matched}?",
  name_matched = ___
))

Edit dan Jalankan Kode