Parquet dosyasından bir veri çerçevesi yükleme
Çalışma alanında sherlock_sentences.parquet adlı bir veri çerçevesi dosyası bulunuyor. Bu veri çerçevesindeki her satır tek bir cümlecik içerir. Her cümlecik; nokta, tırnak işaretleri ve bir cümleyi ya da cümle parçasını belirten diğer doğal dil sınırlayıcıları gibi noktalama işaretleriyle diğer cümleciklerden ayrılmış bir kelime dizisidir. Görevin — kabul edersen — bu dosyayı yüklemek.
Bu egzersiz
Python ile Spark SQL'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
sherlock_sentences.parquetdosyasını yükle.- "id > 70" koşuluyla filtrele ve ilk 5 satırı göster.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Load the dataframe
df = ____('sherlock_sentences.parquet')
# Filter and show the first 5 rows
df.where('id > 70').____(____, truncate=False)