BaşlayınÜcretsiz başlayın

PySpark DataFrame'de veriyi inceleme

Grafikleme, modelleme, eğitim vb. analizlere başlamadan önce veriyi incelemek çok önemlidir. Bu basit egzersizde, önceki egzersizde oluşturduğun people_df DataFrame'indeki veriyi temel DataFrame operatörlerini kullanarak inceleyeceksin.

Unutma, çalışma alanında zaten bir SparkSession spark ve bir DataFrame people_df var.

Bu egzersiz, kursun bir parçasıdır

PySpark ile Big Data Temelleri

Kursa Göz Atın

Egzersiz talimatları

  • people_df DataFrame'inde ilk 10 gözlemi yazdır.
  • people_df DataFrame'indeki satır sayısını say.
  • people_df DataFrame'inde kaç sütun var ve adları neler?

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Print the first 10 observations 
people_df.____(10)

# Count the number of rows 
print("There are {} rows in the people_df DataFrame.".format(people_df.____()))

# Count the number of columns and print their names
print("There are {} columns in the people_df DataFrame and their names are {}".format(len(people_df.____), people_df.____))
Kodu Düzenle ve Çalıştır