Arama yazım hatasına uygun eşleşme bulma
İnsan girdileri hata yapmaya çok açıktır. İnsanlar isimlerini veya adreslerini de içeren her türlü metni yanlış yazabilir ve bir veri bilimci olarak bununla başa çıkmanın bir yolunu bulman gerekir. Dize (string) uzaklıklarını hesaplamak bu sorunu ele almanın bir yoludur.
Küçük usernames vektörümüzde üç farklı isim var. Girilen "Emile Brown" adına mümkün olan en yakın ismi bulman istenecek. usernames vektöründe benzer bir isim bulabilir misin? Vektörde arama yapmak için amatch() kullan ve Google'da gördüğüne benzer bir öneri yazdır.
Bu egzersiz
R ile Orta Düzey Düzenli İfadeler
kursunun bir parçasıdırEgzersiz talimatları
amatch()fonksiyonu için maksimum düzenleme (edit) uzaklığını1olarak belirt.closest_indexiçinde saklanan veamatch()'in döndürdüğü değeri kullanarakusernamesiçindeki ismi yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
usernames <- c("Max Power", "Emilie Brown", "Max Mustermann")
# Search usernames with a maximum edit distance of 1
closest_index <- amatch(
x = "Emile Brown",
table = usernames,
___ = ___,
method = "lv"
)
# Print the matched name in usernames at closest_index
print(glue(
"Did you mean {name_matched}?",
name_matched = ___
))