1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Să reunim totul I

Ai construit o bază solidă în PySpark, ai explorat componentele sale principale și ai lucrat cu scenarii practice ce implică Spark SQL, DataFrame-uri și operații avansate. Acum e momentul să reunești totul. În următoarele două exerciții, vei crea o sesiune SparkSession și un DataFrame, vei face cache acestui DataFrame, vei realiza analize și vei explica rezultatele!

Instrucțiuni

100 XP
  • Importă SparkSession din pyspark.sql.
  • Creează o nouă SparkSession numită final_spark folosind SparkSession.builder.getOrCreate().
  • Afișează my_spark în consolă pentru a verifica că este o SparkSession.
  • Creează un nou DataFrame pornind de la o schemă și o definiție de coloane preîncărcate.