LoslegenKostenlos loslegen

Komplexe Aggregationen

Um dich mit weiteren eingebauten Aggregationsmethoden vertraut zu machen, machen wir eine etwas komplexere Aggregation! Ziel ist es, all diese Befehle in einer einzigen Zeile zusammenzuführen.

Denk daran: Eine SparkSession namens spark ist bereits in deinem Workspace vorhanden, ebenso wie das Spark DataFrame salaries_df.

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Anleitung zur Übung

  • Berechne den durchschnittlichen Lohn großer US-Unternehmen mit der Spalte "salary_in_usd".
  • Berechne die gesamten Löhne großer US-Unternehmen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Average salaries at large us companies
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US").groupBy().____

#set a large companies variable for other analytics
large_companies=salaries_df.filter(salaries_df.company_size == "L").filter(salaries_df.company_location == "US")

# Total salaries in usd
large_companies.groupBy().____.show()
Code bearbeiten und ausführen