BaşlayınÜcretsiz Başlayın

CSV'yi DataFrame'e Yükleme

Önceki egzersizde, bir RDD'den DataFrame oluşturmanın bir yöntemini gördün. Genelde, CSV dosyasından veri yüklemek DataFrame oluşturmanın en yaygın yoludur. Bu egzersizde, çalışma alanında sana file_path olarak verilen people.csv dosyasından bir PySpark DataFrame oluşturacak ve oluşturulan nesnenin bir PySpark DataFrame olduğunu doğrulayacaksın.

Unutma, çalışma alanında zaten bir SparkSession spark ve people.csv dosyasının yolu olan bir file_path değişkenin var.

Bu egzersiz

PySpark ile Big Data Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • people.csv dosyasının yolu olan file_path değişkeninden bir DataFrame oluştur.
  • Çıktının bir PySpark DataFrame olduğunu doğrula.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Create an DataFrame from file_path
people_df = spark.____(file_path, header=True, inferSchema=True)

# Check the type of people_df
print("The type of people_df is", ____(people_df))
Kodu Düzenle ve Çalıştır