Metinlerden sayıları çıkarma
UFO veri kümesindeki length_of_time alanı, metin içinde dakika sayısını barındıran bir metin alanıdır. Burada, düzenli ifadeler kullanarak bu metin alanından o sayıyı çıkaracaksın.
Bu egzersiz
Python'da Machine Learning için Ön İşleme
kursunun bir parçasıdırEgzersiz talimatları
time_stringiçinde sayıları uygun bir RegEx deseniyle ara.length_of_timesütununun her satırı içinreturn_minutes()fonksiyonunu çağırmak üzere.apply()metodunu kullan.- Karşılaştırmak için hem
length_of_timehem deminutessütunlarının.head()çıktısını yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())