Oefenen met queryplannen
Er is een dataframe text_df beschikbaar. Dit dataframe is geregistreerd als een tabel met de naam table1.
Deze oefening maakt deel uit van de cursus
Introductie tot Spark SQL in Python
Oefeninstructies
- Voer explain uit op
text_df. - Voer explain uit op een SQL-query die een "SELECT COUNT(*) as count" op
table1doet. - Voer explain uit op een SQL-query die het aantal unieke woorden in
table1telt.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Run explain on text_df
text_df.____()
# Run explain on "SELECT COUNT(*) AS count FROM table1"
spark.sql("SELECT COUNT(*) AS count FROM table1").____()
# Run explain on "SELECT COUNT(DISTINCT word) AS words FROM table1"
spark.sql("____").____()