Correggi la query difettosa
Questa query viene eseguita correttamente, ma restituisce un risultato errato in una delle righe a causa di un'omissione nella clausola OVER. Riesci a individuare il bug? Riesci a modificare la query in modo che produca un risultato sensato?
Questo esercizio fa parte del corso
Introduzione a Spark SQL in Python
Istruzioni dell'esercizio
- Indica il numero della riga errata come intero.
- Fornisci la clausola (come stringa) che, aggiunta alla clausola OVER, risolve il problema.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
query = """
SELECT
ROW_NUMBER() OVER (ORDER BY time) AS row,
train_id,
station,
time,
LEAD(time,1) OVER (ORDER BY time) AS time_next
FROM schedule
"""
spark.sql(query).show()
# Give the number of the bad row as an integer
bad_row = ____
# Provide the missing clause, SQL keywords in upper case
clause = '____ ____ ____'