pandas ile verileri gruplama
Bir veri ardışık düzeninin çıktısı genellikle "modellenmiş" bir veri kümesidir. Bu veri kümesi, veri tüketicilerine çok fazla işlem yapmadan bilgilere kolay erişim sağlar. pandas ile verileri gruplamak, modellenmiş veri kümeleri oluşturmayı kolaylaştırır.
pandas pd olarak içe aktarıldı ve raw_testing_scores DataFrame'i aşağıdaki biçimde veriler içeriyor:
street_address city math_score reading_score writing_score
01M539 111 Columbia Street Manhattan 657.0 601.0 601.0
02M294 350 Grand Street Manhattan 395.0 411.0 387.0
02M308 350 Grand Street Manhattan 418.0 428.0 415.0
Bu egzersiz
Python ile ETL ve ELT
kursunun bir parçasıdırEgzersiz talimatları
- Yalnızca
"city","math_score","reading_score"ve"writing_score"sütunlarını tutmak için.loc[]kullan. - DataFrame'i
"city"sütununa göre grupla ve her şehrin matematik, okuma ve yazma puanlarının ortalamasını bul. - Gruplanmış bir DataFrame oluşturmak için
transform()fonksiyonunu kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
def transform(raw_data):
# Use .loc[] to only return the needed columns
raw_data = raw_data.____[:, ____]
# Group the data by city, return the grouped DataFrame
grouped_data = raw_data.____(by=["____"], axis=0).____()
return grouped_data
# Transform the data, print the head of the DataFrame
grouped_testing_scores = ____(raw_testing_scores)
print(grouped_testing_scores.head())