LoslegenKostenlos loslegen

Komplexe Aggregationen

Um dich mit weiteren integrierten Aggregationsmethoden vertraut zu machen, führen wir eine etwas komplexere Aggregation durch! Das Ziel ist es, alle diese Befehle in einer einzigen Zeile zu kombinieren.

Denke daran: Eine SparkSession namens spark steht bereits in deinem Workspace zur Verfügung, ebenso wie der Spark DataFrame salaries_df.

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Anleitung zur Übung

  • Berechne die durchschnittlichen Gehälter großer US-Unternehmen mithilfe der Spalte "salary_in_usd".
  • Berechne die Summe aller Gehälter der großen US-Unternehmen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Code bearbeiten und ausführen