MulaiMulai sekarang secara gratis

Transformasi dan pembersihan DataFrame

Setelah data dikurasi menjadi struktur data Python yang bersih, seperti list berisi list, Anda dapat dengan mudah mengonversinya menjadi DataFrame pandas. Anda akan berlatih melakukan hal ini dengan data yang telah dikurasi pada latihan sebelumnya.

Seperti biasa, pandas telah diimpor sebagai pd, dan variabel normalized_testing_scores menyimpan list yang memuat data pengujian tiap sekolah, seperti ditunjukkan di bawah.

[
    ['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
    ...
]   

Latihan ini adalah bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Petunjuk latihan

  • Buat sebuah DataFrame pandas dari list berisi list yang disimpan dalam variabel normalized_testing_scores.
  • Tetapkan nama kolom untuk DataFrame normalized_data.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)

# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]

normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())
Edit dan Jalankan Kode