1. Nauka
  2. /
  3. Kursy
  4. /
  5. Podstawy Big Data z PySpark

Connected

ćwiczenie

Wczytywanie danych w powłoce PySpark

W PySpark obliczenia wyrażamy poprzez operacje na rozproszonych kolekcjach, które są automatycznie zrównoleglane w całym klastrze. W poprzednim ćwiczeniu wczytywałeś listę jako zrównolegloną kolekcję – teraz wczytasz dane z lokalnego pliku w powłoce PySpark.

Pamiętaj, że w swoim środowisku masz już dostęp do SparkContext sc oraz zmiennej file_path zawierającej ścieżkę do pliku README.md.

Instrukcje

100 XP
  • Wczytaj lokalny plik tekstowy README.md w powłoce PySpark.