Komplexe Aggregationen
Um dich mit weiteren integrierten Aggregationsmethoden vertraut zu machen, führen wir eine etwas komplexere Aggregation durch! Das Ziel ist es, alle diese Befehle in einer einzigen Zeile zu kombinieren.
Denke daran: Eine SparkSession namens spark steht bereits in deinem Workspace zur Verfügung, ebenso wie der Spark DataFrame salaries_df.
Diese Übung ist Teil des Kurses
<Kurs>Einführung in PySpark</Kurs>Übungsanweisungen
- Berechne die durchschnittlichen Gehälter großer US-Unternehmen mithilfe der Spalte
"salary_in_usd". - Berechne die Summe aller Gehälter der großen US-Unternehmen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____
#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")
# Total salaries in usd
large_companies.groupBy().____.show()