Birden çok tabloyu birleştirme
Şimdi farklı bir yoldan ilerleyip punt sırasında oyuncu pozisyonlarını eşlemek istiyorsun. Hatırlarsan NextGenStats (NGS) sistemi, her oyunda tüm oyuncular için saniyede 10 kez oyuncu konumlarını ve yönelimlerini yakalıyor. Epey veri var!
Analize hazırlık için üç veri çerçevesini birleştireceksin. Aşağıda adları ve açıklamaları yer alıyor.
games: GameKey'e göre üst düzey veripunts: GameKey ve PlayId'ye göre oyun düzeyi verings: GameKey, PlayId, GSISID (oyuncu kimliği) ve Time'a göre konum verisi
Ekip arkadaşlarından biri, her bir veri çerçevesinin indeksini tek satırda yazdırmak için 2. satıra bir liste üreteci ekledi. Liste üreteçleri hakkında daha fazla bilgi için Python Data Science Toolbox Part 2'ye göz at.
Bu egzersiz, kursun bir parçasıdır
Elektronik Tablo Kullanıcıları için pandas Join'leri
Egzersiz talimatları
gamesi birincil veri çerçevesi olarak kullanarak veri çerçevelerini indekse göre inner join ile birleştir.- Ortaya çıkan veri çerçevesinin ilk 10 satırına bak.
- Yeni çerçevenin indeksinde yinelenen (duplicate) olmadığından emin ol.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# List the index of each data frame
print([[n for n in df.index.names] for df in [games, punts, ngs]])
# Inner join the data frames
games_all = ____.____([punts, ____], how=____)
# View first 10 rows of new frame
print(____.head(10))
# Check index for duplicates
print(____.index.____.sum())