BaşlayınÜcretsiz Başlayın

PySpark DataFrame'de veriyi inceleme

Grafikleme, modelleme, eğitim vb. analizlere başlamadan önce veriyi incelemek çok önemlidir. Bu basit egzersizde, önceki egzersizde oluşturduğun people_df DataFrame'indeki veriyi temel DataFrame operatörlerini kullanarak inceleyeceksin.

Unutma, çalışma alanında zaten bir SparkSession spark ve bir DataFrame people_df var.

Bu egzersiz

PySpark ile Big Data Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • people_df DataFrame'inde ilk 10 gözlemi yazdır.
  • people_df DataFrame'indeki satır sayısını say.
  • people_df DataFrame'inde kaç sütun var ve adları neler?

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Print the first 10 observations 
people_df.____(10)

# Count the number of rows 
print("There are {} rows in the people_df DataFrame.".format(people_df.____()))

# Count the number of columns and print their names
print("There are {} columns in the people_df DataFrame and their names are {}".format(len(people_df.____), people_df.____))
Kodu Düzenle ve Çalıştır