1. Learn
  2. /
  3. Курси
  4. /
  5. Introduction to PySpark

Connected

вправа

Vytváření RDD

V PySparku můžeš RDD (Resilient Distributed Dataset) vytvořit několika různými způsoby. Protože už DataFrames znáš, vytvoříš ho právě z DataFrame. Nezapomeň, že ve svém pracovním prostředí máš k dispozici SparkSession s názvem spark!

Інструкції

100 XP
  • Vytvoř DataFrame z poskytnutého seznamu a ulož ho jako df.
  • Převeď DataFrame na RDD.
  • Získej obsah výsledného RDD pomocí collect a vypiš ho.