Mengekstrak angka dari string
Field length_of_time dalam himpunan data UFO adalah field teks yang berisi jumlah menit di dalam string. Di sini, Anda akan mengekstrak angka tersebut dari field teks menggunakan regular expression.
Latihan ini adalah bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Petunjuk latihan
- Cari angka dalam
time_stringmenggunakan pola RegEx yang sesuai. - Gunakan metode
.apply()untuk memanggilreturn_minutes()pada setiap baris kolomlength_of_time. - Cetak
.head()dari kolomlength_of_timedanminutesuntuk membandingkan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())