Dizge kalıplarını çıkarma
hiking veri kümesindeki Length sütunu dizgelerden oluşuyor, ancak bu sütunda yürüyüşün mil cinsinden uzunluğu yer alıyor. Bu mil bilgisini düzenli ifadeler kullanarak çıkaracağız ve ardından pandas'ta bir lambda ile bu çıkarımı DataFrame'e uygulayacağız.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
lengthargümanındaki metinde sayıları ve ondalıkları uygun bir desenle ara.- Eşleşen deseni çıkar ve float'a dönüştür.
return_mileage()fonksiyonunuhiking["Length"]sütunundaki her satıra uygula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Write a pattern to extract numbers and decimals
def return_mileage(length):
# Search the text for matches
mile = re.____(____, ____)
# If a value is returned, use group(0) to return the found value
if mile is not None:
return float(____)
# Apply the function to the Length column and take a look at both columns
hiking["Length_num"] = ____.apply(____)
print(hiking[["Length", "Length_num"]].head())