1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în PySpark

Connected

exercițiu

Crearea RDD-urilor

În PySpark, poți crea un RDD (Resilient Distributed Dataset) în câteva moduri diferite. Deoarece ești deja familiarizat cu DataFrame-urile, vei configura acest lucru pornind de la un DataFrame. Reține că în workspace-ul tău există deja o SparkSession numită spark!

Instrucțiuni

100 XP
  • Creează un DataFrame din lista furnizată, numit df.
  • Convertește DataFrame-ul într-un RDD.
  • Colectează și afișează RDD-ul rezultat.