PySpark DataFrame'de veriyi inceleme
Grafikleme, modelleme, eğitim vb. analizlere başlamadan önce veriyi incelemek çok önemlidir. Bu basit egzersizde, önceki egzersizde oluşturduğun people_df DataFrame'indeki veriyi temel DataFrame operatörlerini kullanarak inceleyeceksin.
Unutma, çalışma alanında zaten bir SparkSession spark ve bir DataFrame people_df var.
Bu egzersiz
PySpark ile Big Data Temelleri
kursunun bir parçasıdırEgzersiz talimatları
people_dfDataFrame'inde ilk 10 gözlemi yazdır.people_dfDataFrame'indeki satır sayısını say.people_dfDataFrame'inde kaç sütun var ve adları neler?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print the first 10 observations
people_df.____(10)
# Count the number of rows
print("There are {} rows in the people_df DataFrame.".format(people_df.____()))
# Count the number of columns and print their names
print("There are {} columns in the people_df DataFrame and their names are {}".format(len(people_df.____), people_df.____))