1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Feature Engineering with PySpark

Connected

cvičení

Spark SQL Join

Někdy je jednodušší napsat složitější joiny přímo v SQL. V tomto cvičení jsou klíče pro join už ve stejném formátu i přesnosti – využijeme SparkSQL k samotnému spojení tabulek.

Pokyny

100 XP
  • Zaregistruj oba DataFramy jako SparkSQL tabulky pomocí createOrReplaceTempView a pojmenuj je df a walk_df.
  • V řetězci join_sql nastav levou tabulku na df a pravou na walk_df.
  • Zavolej spark.sql() na řetězci join_sql, čímž join provedeš.