1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark SQL w Pythonie

Connected

ćwiczenie

Wczytywanie ramki danych z pliku parquet

W twoim środowisku roboczym dostępny jest plik sherlock_sentences.parquet zawierający ramkę danych. Każdy wiersz tej ramki to pojedyncze zdanie składowe – sekwencja słów oddzielona od pozostałych zdań znakami interpunkcyjnymi, takimi jak kropki, cudzysłowy i inne naturalne separatory języka. Twoim zadaniem jest wczytanie tego pliku.

Instrukcje

100 XP
  • Wczytaj plik sherlock_sentences.parquet.
  • Odfiltruj wiersze spełniające warunek "id > 70" i wyświetl pierwsze 5 wierszy.