Bir metin sütununu split ve explode et
100 satırlık bir clauses_df veri çerçevesi sağlandı. clause adlı bir sütunu ve bir satır kimliği var. Her clause, aralarında boşluk olan bir veya daha fazla kelime içeren bir string'dir.
Bu egzersiz
Python ile Spark SQL'e Giriş
kursunun bir parçasıdırEgzersiz talimatları
clausesütununu, tek tek kelimelerden oluşan bir dizi içerenwordsadlı bir sütuna böl.wordssütununuwordadlı bir sütuna explode et.- Ortaya çıkan satır sayısını say.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Split the clause column into a column called words
split_df = clauses_df.select(____('clause', ' ').____('words'))
split_df.show(5, truncate=False)
# Explode the words column into a column called word
exploded_df = split_df.____(____('____').____('word'))
exploded_df.show(10)
# Count the resulting number of rows in exploded_df
print("\nNumber of rows: ", ____)