Sorgu planlarını okumayı pekiştir 2
Üç dataframe hazır: part2_df, part3_df ve part4_df. Bu egzersizdeki soruların yanıtlarını her bir dataframe'in explain() çıktısını inceleyerek bulabilirsin.
Spark'ın her sütun adını # sembolüyle ayrılan bir tanımlayıcıyla etiketlediğini unutma. Örneğin, word#0, id#1L, part#2 ve title#3. Bu egzersizin amacı için bu tanımlayıcıları yok sayabilirsin.
Bu egzersiz
Python ile Spark SQL'e Giriş
kursunun bir parçasıdırUygulamalı interaktif egzersiz
İnteraktif egzersizlerimizden biriyle teoriyi pratiğe dökün
Egzersizi başlat