LoslegenKostenlos starten

Komplexe Aggregationen

Um dich mit weiteren integrierten Aggregationsmethoden vertraut zu machen, führen wir eine etwas komplexere Aggregation durch! Das Ziel ist es, alle diese Befehle in einer einzigen Zeile zu kombinieren.

Denke daran: Eine SparkSession namens spark steht bereits in deinem Workspace zur Verfügung, ebenso wie der Spark DataFrame salaries_df.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in PySpark</Kurs>
Kurs ansehen

Übungsanweisungen

  • Berechne die durchschnittlichen Gehälter großer US-Unternehmen mithilfe der Spalte "salary_in_usd".
  • Berechne die Summe aller Gehälter der großen US-Unternehmen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Code bearbeiten und ausführen