Komplexe Aggregationen
Um dich mit weiteren eingebauten Aggregationsmethoden vertraut zu machen, machen wir eine etwas komplexere Aggregation! Ziel ist es, all diese Befehle in einer einzigen Zeile zusammenzuführen.
Denk daran: Eine SparkSession namens spark ist bereits in deinem Workspace vorhanden, ebenso wie das Spark DataFrame salaries_df.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Berechne den durchschnittlichen Lohn großer US-Unternehmen mit der Spalte
"salary_in_usd". - Berechne die gesamten Löhne großer US-Unternehmen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()