Transformasi dan pembersihan DataFrame
Setelah data dikurasi menjadi struktur data Python yang bersih, seperti list berisi list, Anda dapat dengan mudah mengonversinya menjadi DataFrame pandas. Anda akan berlatih melakukan hal ini dengan data yang telah dikurasi pada latihan sebelumnya.
Seperti biasa, pandas telah diimpor sebagai pd, dan variabel normalized_testing_scores menyimpan list yang memuat data pengujian tiap sekolah, seperti ditunjukkan di bawah.
[
['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
...
]
Latihan ini merupakan bagian dari kursus
ETL dan ELT di Python
Instruksi latihan
- Buat sebuah DataFrame
pandasdari list berisi list yang disimpan dalam variabelnormalized_testing_scores. - Tetapkan nama kolom untuk DataFrame
normalized_data.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)
# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]
normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())