Übe das Lesen von Abfrageplänen 2
Drei DataFrames stehen zur Verfügung: part2_df, part3_df und part4_df. Die Fragen in dieser Übung lassen sich beantworten, indem du die Ausgabe von explain() für jeden DataFrame überprüfst.
Beachte, dass Spark jeden Spaltennamen mit einem Deskriptor versieht, der durch ein #-Symbol getrennt ist. Zum Beispiel word#0, id#1L, part#2 und title#3. Für diese Übung kannst du diese Deskriptoren ignorieren.
Diese Übung ist Teil des Kurses
Einführung in Spark SQL mit Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten