1. Nauka
  2. /
  3. Kursy
  4. /
  5. Podstawy Big Data z PySpark

Connected

ćwiczenie

Eksploracja danych w DataFrame PySpark

Dokładna eksploracja danych przed analizą – taką jak wizualizacja, modelowanie czy trenowanie – jest niezwykle ważna. W tym ćwiczeniu przyjrzysz się danym w DataFrame people_df, który został utworzony w poprzednim ćwiczeniu, korzystając z podstawowych operatorów DataFrame.

Pamiętaj, że masz już dostęp do SparkSession spark oraz DataFrame people_df w swoim środowisku pracy.

Instrukcje

100 XP
  • Wyświetl pierwsze 10 obserwacji z DataFrame people_df.
  • Policz liczbę wierszy w DataFrame people_df.
  • Ile kolumn ma DataFrame people_df i jak się nazywają?