BaşlayınÜcretsiz Başlayın

Köpek ayrıştırma

Başlangıç veri kümesinde hatırı sayılır bir temizlik yaptın, ancak şimdi veriyi biraz daha derinlemesine analiz etmen gerekiyor. Bir görüntüde görülen köpek türü ve görsellere ilişkin bazı ayrıntılar hakkında birkaç soru ortaya çıktı. Bu soruları yanıtlamak için veriyi belirli bir türe dönüştürmen gerektiğini fark ettin. Bunu kullanmadan önce, köpek ayrıntılarını temsil edecek bir şema/tip oluşturman gerekecek.

joined_df DataFrame’i en son tanımladığın hâliyle duruyor ve pyspark.sql.types tamamen içe aktarılmış durumda.

Bu egzersiz

PySpark ile Veri Temizleme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • DataFrame’den köpek ayrıntılarını temsil eden sütunu seç ve ilk 10 satırı kesilmeden (un-truncated) göster.
  • Daha önce yaptığın gibi yeni bir şema oluştur; adlar olarak breed, start_x, start_y, end_x ve end_y kullan. Şemadaki her alan için uygun veri tiplerini belirtmeyi unutma (sayı olan tüm değerler integer’dır).

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Select the dog details and show 10 untruncated rows
print(joined_df.____.show(____, truncate=____))

# Define a schema type for the details in the dog list
DogType = ____([
	StructField("breed", ____, False),
    StructField("start_x", ____, False),
    ____,
    ____,
    ____
])
Kodu Düzenle ve Çalıştır