Sorgu planlarını okumayı pekiştir 2
Üç dataframe hazır: part2_df, part3_df ve part4_df. Bu egzersizdeki soruların yanıtlarını her bir dataframe'in explain() çıktısını inceleyerek bulabilirsin.
Spark'ın her sütun adını # sembolüyle ayrılan bir tanımlayıcıyla etiketlediğini unutma. Örneğin, word#0, id#1L, part#2 ve title#3. Bu egzersizin amacı için bu tanımlayıcıları yok sayabilirsin.
Bu egzersiz, kursun bir parçasıdır
Python ile Spark SQL'e Giriş
Uygulamalı etkileşimli egzersiz
Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle
Egzersize başla