Pengodean sederhana untuk penggabungan kompleks
Kabar baik! Anda memiliki akses ke data Next Gen Stats (NGS) liga. NGS merekam lokasi dan orientasi setiap pemain pada setiap permainan. Data dicatat 10 kali per detik, yang berarti ada lebih dari 1,5 juta observasi per minggu hanya untuk punt! Data ini sudah dimuat ke dalam data frame bernama coords.
Anda juga memiliki data umum untuk setiap punt yang sesuai dengan punt yang dilacak oleh NGS. Baris dalam data frame ini, bernama punts, diidentifikasi oleh kombinasi unik GameKey dan PlayId.
Untuk menggabungkan data di lingkungan spreadsheet, Anda akan membuat kolom pada masing-masing tabel yang menggabungkan GameKey dan PlayId, lalu mencocokkan tabel berdasarkan kolom baru tersebut. Di sini, Anda dapat mencoba pernyataan merge sederhana untuk menggabungkan punts dan coords.
Latihan ini adalah bagian dari kursus
Menggabungkan Data dengan Pandas untuk Pengguna Spreadsheet
Petunjuk latihan
- Tampilkan 10 baris pertama dari
punts. Perhatikan bahwa baris bersifat unik untuk setiap kombinasiGameKey-PlayId. - Tampilkan 10 baris pertama dari
coords. - Gabungkan kedua data frame dengan
puntssebagai data frame kiri dancoordssebagai data frame kanan. - Tampilkan 15 baris pertama dari data frame baru,
punts_w_coords.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# View punts
print(____.head(10))
# View coords
print(____.head(10))
# Merge data frames
punts_w_coords = ____.merge(____)
# View new data frame
print(____.head(15))