1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark SQL w Pythonie

Connected

ćwiczenie

Ćwiczenie z odczytywania planów zapytań 2

Dostępne są trzy ramki danych: part2_df, part3_df i part4_df. Odpowiedzi na pytania w tym ćwiczeniu można znaleźć, analizując wynik explain() każdej z tych ramek danych.

Zwróć uwagę, że Spark oznacza każdą nazwę kolumny deskryptorem oddzielonym symbolem #. Na przykład: word#0, id#1L, part#2 i title#3. Na potrzeby tego ćwiczenia możesz pominąć te deskryptory.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4

Pytanie

  • Z jakiego pliku załadowano part2_df? Podaj tylko nazwę pliku wraz z rozszerzeniem – pełna ścieżka nie jest potrzebna.

Możliwe odpowiedzi