Menjumlahkan string dan menggabungkan angka
Pada latihan sebelumnya, Anda telah mengidentifikasi bahwa category adalah tipe data yang tepat untuk user_type dan mengonversinya agar dapat mengekstrak ringkasan statistik yang relevan tentang sebaran user_type.
Masalah tipe data umum lainnya adalah ketika nilai yang seharusnya numerik diimpor sebagai string, sehingga operasi matematika seperti penjumlahan dan perkalian justru menghasilkan penggabungan string, bukan keluaran numerik.
Dalam latihan ini, Anda akan mengonversi kolom string duration menjadi tipe int. Namun sebelumnya, Anda perlu memastikan untuk menghapus "minutes" dari kolom tersebut agar pandas membacanya sebagai numerik. Paket pandas telah diimpor sebagai pd.
Latihan ini adalah bagian dari kursus
Membersihkan Data di Python
Petunjuk latihan
- Gunakan metode
.strip()untuk menghapus"minutes"daridurationdan simpan hasilnya ke kolomduration_trim. - Konversi
duration_trimkeintdan simpan ke kolomduration_time. - Tulis pernyataan
assertyang memeriksa apakah tipe data (**type**)duration_timesekarang adalahint. - Cetak rata-rata durasi perjalanan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()
# Convert duration to integer
ride_sharing['duration_time'] = ____
# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'
# Print formed columns and calculate average ride duration
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)