BaşlayınÜcretsiz Başlayın

pandas ile verileri gruplama

Bir veri ardışık düzeninin çıktısı genellikle "modellenmiş" bir veri kümesidir. Bu veri kümesi, veri tüketicilerine çok fazla işlem yapmadan bilgilere kolay erişim sağlar. pandas ile verileri gruplamak, modellenmiş veri kümeleri oluşturmayı kolaylaştırır.

pandas pd olarak içe aktarıldı ve raw_testing_scores DataFrame'i aşağıdaki biçimde veriler içeriyor:

              street_address       city  math_score  reading_score  writing_score
01M539   111 Columbia Street  Manhattan       657.0          601.0          601.0
02M294      350 Grand Street  Manhattan       395.0          411.0          387.0
02M308      350 Grand Street  Manhattan       418.0          428.0          415.0

Bu egzersiz

Python ile ETL ve ELT

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Yalnızca "city", "math_score", "reading_score" ve "writing_score" sütunlarını tutmak için .loc[] kullan.
  • DataFrame'i "city" sütununa göre grupla ve her şehrin matematik, okuma ve yazma puanlarının ortalamasını bul.
  • Gruplanmış bir DataFrame oluşturmak için transform() fonksiyonunu kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

def transform(raw_data):
	# Use .loc[] to only return the needed columns
	raw_data = raw_data.____[:, ____]
	
    # Group the data by city, return the grouped DataFrame
	grouped_data = raw_data.____(by=["____"], axis=0).____()
	return grouped_data

# Transform the data, print the head of the DataFrame
grouped_testing_scores = ____(raw_testing_scores)
print(grouped_testing_scores.head())
Kodu Düzenle ve Çalıştır