Menggabungkan beberapa tabel
Sekarang Anda ingin menempuh pendekatan lain dan memetakan posisi pemain saat punt. Anda mungkin ingat bahwa sistem NextGenStats (NGS) merekam posisi dan orientasi pemain 10 kali per detik untuk semua pemain di setiap permainan. Jumlah datanya sangat besar!
Anda akan menggabungkan tiga data frame untuk disiapkan sebelum analisis. Berikut nama dan deskripsinya.
games: data tingkat tinggi berdasarkan GameKeypunts: data tingkat permainan berdasarkan GameKey dan PlayIdngs: data posisi berdasarkan GameKey, PlayId, GSISID (id pemain), dan Time
Seorang anggota tim Anda telah menyediakan list comprehension pada baris 2 untuk mencetak indeks tiap data frame dalam satu baris kode. Untuk informasi lebih lanjut tentang list comprehension, lihat Python Data Science Toolbox Bagian 2.
Latihan ini adalah bagian dari kursus
Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet
Petunjuk latihan
- Lakukan inner join pada data frame berdasarkan indeks dengan
gamessebagai data frame utama. - Tampilkan 10 baris pertama dari data frame hasilnya.
- Pastikan indeks pada frame baru tidak memiliki duplikat.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])
# Inner join the data frames
games_all = ____.____([punts, ____], how=____)
# View first 10 rows of new frame
print(____.head(10))
# Check index for duplicates
print(____.index.____.sum())