BaşlayınÜcretsiz Başlayın

Bir metin sütununu split ve explode et

100 satırlık bir clauses_df veri çerçevesi sağlandı. clause adlı bir sütunu ve bir satır kimliği var. Her clause, aralarında boşluk olan bir veya daha fazla kelime içeren bir string'dir.

Bu egzersiz

Python ile Spark SQL'e Giriş

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • clause sütununu, tek tek kelimelerden oluşan bir dizi içeren words adlı bir sütuna böl.
  • words sütununu word adlı bir sütuna explode et.
  • Ortaya çıkan satır sayısını say.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Split the clause column into a column called words 
split_df = clauses_df.select(____('clause', ' ').____('words'))
split_df.show(5, truncate=False)

# Explode the words column into a column called word 
exploded_df = split_df.____(____('____').____('word'))
exploded_df.show(10)

# Count the resulting number of rows in exploded_df
print("\nNumber of rows: ", ____)
Kodu Düzenle ve Çalıştır