BaşlayınÜcretsiz Başlayın

Parquet dosyasından bir veri çerçevesi yükleme

Çalışma alanında sherlock_sentences.parquet adlı bir veri çerçevesi dosyası bulunuyor. Bu veri çerçevesindeki her satır tek bir cümlecik içerir. Her cümlecik; nokta, tırnak işaretleri ve bir cümleyi ya da cümle parçasını belirten diğer doğal dil sınırlayıcıları gibi noktalama işaretleriyle diğer cümleciklerden ayrılmış bir kelime dizisidir. Görevin — kabul edersen — bu dosyayı yüklemek.

Bu egzersiz

Python ile Spark SQL'e Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • sherlock_sentences.parquet dosyasını yükle.
  • "id > 70" koşuluyla filtrele ve ilk 5 satırı göster.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Load the dataframe
df = ____('sherlock_sentences.parquet')

# Filter and show the first 5 rows
df.where('id > 70').____(____, truncate=False)
Kodu Düzenle ve Çalıştır