Übe das Lesen von Abfrageplänen 2
Drei DataFrames stehen zur Verfügung: part2_df, part3_df und part4_df. Die Fragen in dieser Übung lassen sich beantworten, indem du die Ausgabe von explain() für jeden DataFrame überprüfst.
Beachte, dass Spark jeden Spaltennamen mit einem Deskriptor versieht, der durch ein #-Symbol getrennt ist. Zum Beispiel word#0, id#1L, part#2 und title#3. Für diese Übung kannst du diese Deskriptoren ignorieren.
Diese Übung ist Teil des Kurses
<Kurs>Einführung in Spark SQL mit Python</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten