Menerapkan transformasi lanjutan pada DataFrame
pandas memiliki banyak alat transformasi bawaan, tetapi terkadang logika yang lebih lanjut perlu digunakan dalam sebuah transformasi. Fungsi apply memungkinkan Anda menerapkan fungsi buatan pengguna ke baris atau kolom pada DataFrame, membuka peluang untuk transformasi lanjutan dan pembuatan fitur.
Fungsi find_street_name() mengekstrak nama jalan dari "street_address" dengan menghapus nomor jalan dari string tersebut. Fungsi ini sudah dimuat ke memori dan siap diterapkan pada DataFrame raw_testing_scores.
Latihan ini adalah bagian dari kursus
ETL dan ELT di Python
Petunjuk latihan
- Dalam definisi fungsi
transform(), gunakan fungsifind_street_name()untuk membuat kolom baru bernama"street_name". - Gunakan fungsi
transform()untuk membersihkan DataFrameraw_testing_scores. - Cetak head dari DataFrame
cleaned_testing_scores, lalu amati kolom baru"street_name".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
def transform(raw_data):
# Use the apply function to extract the street_name from the street_address
raw_data["street_name"] = raw_data.____(
# Pass the correct function to the apply method
____,
axis=1
)
return raw_data
# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)
# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())