Bir metin sütununu split ve explode et
100 satırlık bir clauses_df veri çerçevesi sağlandı. clause adlı bir sütunu ve bir satır kimliği var. Her clause, aralarında boşluk olan bir veya daha fazla kelime içeren bir string'dir.
Bu egzersiz, kursun bir parçasıdır
Python ile Spark SQL'e Giriş
Egzersiz talimatları
clausesütununu, tek tek kelimelerden oluşan bir dizi içerenwordsadlı bir sütuna böl.wordssütununuwordadlı bir sütuna explode et.- Ortaya çıkan satır sayısını say.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Split the clause column into a column called words
split_df = clauses_df.select(____('clause', ' ').____('words'))
split_df.show(5, truncate=False)
# Explode the words column into a column called word
exploded_df = split_df.____(____('____').____('word'))
exploded_df.show(10)
# Count the resulting number of rows in exploded_df
print("\nNumber of rows: ", ____)