Mengekstrak angka dari string
Field length_of_time dalam himpunan data UFO adalah field teks yang berisi jumlah menit di dalam string. Di sini, Anda akan mengekstrak angka tersebut dari field teks menggunakan regular expression.
Latihan ini merupakan bagian dari kursus
Prapemrosesan untuk Machine Learning di Python
Instruksi latihan
- Cari angka dalam
time_stringmenggunakan pola RegEx yang sesuai. - Gunakan metode
.apply()untuk memanggilreturn_minutes()pada setiap baris kolomlength_of_time. - Cetak
.head()dari kolomlength_of_timedanminutesuntuk membandingkan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
def return_minutes(time_string):
# Search for numbers in time_string
num = re.____(____, ____)
if num is not None:
return int(num.group(0))
# Apply the extraction to the length_of_time column
ufo["minutes"] = ufo["length_of_time"].____
# Take a look at the head of both of the columns
print(ufo[[____]].head())