Mulai sekarangMulai gratis

Transformasi dan pembersihan DataFrame

Setelah data dikurasi menjadi struktur data Python yang bersih, seperti list berisi list, Anda dapat dengan mudah mengonversinya menjadi DataFrame pandas. Anda akan berlatih melakukan hal ini dengan data yang telah dikurasi pada latihan sebelumnya.

Seperti biasa, pandas telah diimpor sebagai pd, dan variabel normalized_testing_scores menyimpan list yang memuat data pengujian tiap sekolah, seperti ditunjukkan di bawah.

[
    ['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
    ...
]   

Latihan ini merupakan bagian dari kursus

ETL dan ELT di Python

Lihat Kursus

Instruksi latihan

  • Buat sebuah DataFrame pandas dari list berisi list yang disimpan dalam variabel normalized_testing_scores.
  • Tetapkan nama kolom untuk DataFrame normalized_data.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)

# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]

normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())
Edit dan Jalankan Kode