1. Обучение
  2. /
  3. Курса
  4. /
  5. Wprowadzenie do PySpark

Connected

упражнение

Tworzenie RDD

W PySpark możesz utworzyć RDD (Resilient Distributed Dataset) na kilka sposobów. Ponieważ znasz już DataFrames, skonfigurujemy to na ich podstawie. Pamiętaj, że w twoim środowisku pracy jest już dostępna sesja SparkSession o nazwie spark!

Инструкции

100 XP
  • Utwórz DataFrame z dostarczonej listy i nazwij go df.
  • Przekonwertuj DataFrame na RDD.
  • Pobierz zawartość RDD za pomocą collect i wyświetl wynik.