BaşlayınÜcretsiz başlayın

CSV'yi DataFrame'e Yükleme

Önceki egzersizde, bir RDD'den DataFrame oluşturmanın bir yöntemini gördün. Genelde, CSV dosyasından veri yüklemek DataFrame oluşturmanın en yaygın yoludur. Bu egzersizde, çalışma alanında sana file_path olarak verilen people.csv dosyasından bir PySpark DataFrame oluşturacak ve oluşturulan nesnenin bir PySpark DataFrame olduğunu doğrulayacaksın.

Unutma, çalışma alanında zaten bir SparkSession spark ve people.csv dosyasının yolu olan bir file_path değişkenin var.

Bu egzersiz, kursun bir parçasıdır

PySpark ile Big Data Temelleri

Kursa Göz Atın

Egzersiz talimatları

  • people.csv dosyasının yolu olan file_path değişkeninden bir DataFrame oluştur.
  • Çıktının bir PySpark DataFrame olduğunu doğrula.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create an DataFrame from file_path
people_df = spark.____(file_path, header=True, inferSchema=True)

# Check the type of people_df
print("The type of people_df is", ____(people_df))
Kodu Düzenle ve Çalıştır