1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to PySpark

Connected

cvičení

Inference a filtrování

Představ si, že máš census dataset s hlavičkou a schématem. Pojďme ho načíst a nechat PySpark, ať schéma odvodí sám. Co uvidíš, když vyfiltrujeme dospělé starší 40 let?

Nezapomeň, že v tvém pracovním prostředí už máš k dispozici SparkSession s názvem spark!

Pokyny

100 XP
  • Načti JSON soubor adults.json.
  • Vyfiltruj data tak, aby zahrnovala pouze dospělé starší 40 let (sloupec age).
  • Zobraz výsledky.