Komplexe Aggregationen
Um dich mit weiteren integrierten Aggregationsmethoden vertraut zu machen, führen wir eine etwas komplexere Aggregation durch! Das Ziel ist es, alle diese Befehle in einer einzigen Zeile zu kombinieren.
Denke daran: Eine SparkSession namens spark steht bereits in deinem Workspace zur Verfügung, ebenso wie der Spark DataFrame salaries_df.
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Berechne die durchschnittlichen Gehälter großer US-Unternehmen mithilfe der Spalte
"salary_in_usd". - Berechne die Summe aller Gehälter der großen US-Unternehmen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()