CSV'yi DataFrame'e Yükleme
Önceki egzersizde, bir RDD'den DataFrame oluşturmanın bir yöntemini gördün. Genelde, CSV dosyasından veri yüklemek DataFrame oluşturmanın en yaygın yoludur. Bu egzersizde, çalışma alanında sana file_path olarak verilen people.csv dosyasından bir PySpark DataFrame oluşturacak ve oluşturulan nesnenin bir PySpark DataFrame olduğunu doğrulayacaksın.
Unutma, çalışma alanında zaten bir SparkSession spark ve people.csv dosyasının yolu olan bir file_path değişkenin var.
Bu egzersiz, kursun bir parçasıdır
PySpark ile Big Data Temelleri
Egzersiz talimatları
people.csvdosyasının yolu olanfile_pathdeğişkeninden bir DataFrame oluştur.- Çıktının bir PySpark DataFrame olduğunu doğrula.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create an DataFrame from file_path
people_df = spark.____(file_path, header=True, inferSchema=True)
# Check the type of people_df
print("The type of people_df is", ____(people_df))