1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to PySpark

Connected

cvičení

Vše dohromady I

Máš za sebou solidní základy PySparku, seznámil/a ses s jeho klíčovými komponentami a procvičil/a práci se Spark SQL, DataFramy i pokročilými operacemi. Teď je čas dát to všechno dohromady. V následujících dvou cvičeních vytvoříš SparkSession a DataFrame, DataFrame uložíš do mezipaměti, provedeš analýzu dat a vysvětlíš výsledek!

Pokyny

100 XP
  • Importuj SparkSession z pyspark.sql.
  • Vytvoř novou SparkSession s názvem final_spark pomocí SparkSession.builder.getOrCreate().
  • Vypiš my_spark do konzole a ověř, že se jedná o SparkSession.
  • Vytvoř nový DataFrame z předem načteného schématu a definice sloupců.