CSV'yi DataFrame'e Yükleme
Önceki egzersizde, bir RDD'den DataFrame oluşturmanın bir yöntemini gördün. Genelde, CSV dosyasından veri yüklemek DataFrame oluşturmanın en yaygın yoludur. Bu egzersizde, çalışma alanında sana file_path olarak verilen people.csv dosyasından bir PySpark DataFrame oluşturacak ve oluşturulan nesnenin bir PySpark DataFrame olduğunu doğrulayacaksın.
Unutma, çalışma alanında zaten bir SparkSession spark ve people.csv dosyasının yolu olan bir file_path değişkenin var.
Bu egzersiz
PySpark ile Big Data Temelleri
kursunun bir parçasıdırEgzersiz talimatları
people.csvdosyasının yolu olanfile_pathdeğişkeninden bir DataFrame oluştur.- Çıktının bir PySpark DataFrame olduğunu doğrula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create an DataFrame from file_path
people_df = spark.____(file_path, header=True, inferSchema=True)
# Check the type of people_df
print("The type of people_df is", ____(people_df))