BaşlayınÜcretsiz Başlayın

Birden çok tabloyu birleştirme

Şimdi farklı bir yoldan ilerleyip punt sırasında oyuncu pozisyonlarını eşlemek istiyorsun. Hatırlarsan NextGenStats (NGS) sistemi, her oyunda tüm oyuncular için saniyede 10 kez oyuncu konumlarını ve yönelimlerini yakalıyor. Epey veri var!

Analize hazırlık için üç veri çerçevesini birleştireceksin. Aşağıda adları ve açıklamaları yer alıyor.

  • games: GameKey'e göre üst düzey veri
  • punts: GameKey ve PlayId'ye göre oyun düzeyi veri
  • ngs: GameKey, PlayId, GSISID (oyuncu kimliği) ve Time'a göre konum verisi

Ekip arkadaşlarından biri, her bir veri çerçevesinin indeksini tek satırda yazdırmak için 2. satıra bir liste üreteci ekledi. Liste üreteçleri hakkında daha fazla bilgi için Python Data Science Toolbox Part 2'ye göz at.

Bu egzersiz

Elektronik Tablo Kullanıcıları için pandas Join'leri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • gamesi birincil veri çerçevesi olarak kullanarak veri çerçevelerini indekse göre inner join ile birleştir.
  • Ortaya çıkan veri çerçevesinin ilk 10 satırına bak.
  • Yeni çerçevenin indeksinde yinelenen (duplicate) olmadığından emin ol.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])

# Inner join the data frames
games_all = ____.____([punts, ____], how=____)

# View first 10 rows of new frame
print(____.head(10))

# Check index for duplicates
print(____.index.____.sum())
Kodu Düzenle ve Çalıştır