BaşlayınÜcretsiz başlayın

Bir metin sütununu split ve explode et

100 satırlık bir clauses_df veri çerçevesi sağlandı. clause adlı bir sütunu ve bir satır kimliği var. Her clause, aralarında boşluk olan bir veya daha fazla kelime içeren bir string'dir.

Bu egzersiz, kursun bir parçasıdır

Python ile Spark SQL'e Giriş

Kursa Göz Atın

Egzersiz talimatları

  • clause sütununu, tek tek kelimelerden oluşan bir dizi içeren words adlı bir sütuna böl.
  • words sütununu word adlı bir sütuna explode et.
  • Ortaya çıkan satır sayısını say.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Split the clause column into a column called words 
split_df = clauses_df.select(____('clause', ' ').____('words'))
split_df.show(5, truncate=False)

# Explode the words column into a column called word 
exploded_df = split_df.____(____('____').____('word'))
exploded_df.show(10)

# Count the resulting number of rows in exploded_df
print("\nNumber of rows: ", ____)
Kodu Düzenle ve Çalıştır