Corriger la requête défectueuse
Cette requête s'exécute correctement, mais renvoie un résultat incorrect dans l'une des lignes en raison d'un oubli dans la clause OVER. Pouvez-vous localiser l'erreur ? Pouvez-vous modifier la requête pour qu'elle renvoie un résultat cohérent ?
Cet exercice fait partie du cours
Introduction à Spark SQL en Python
Instructions
- Indiquez le numéro de la ligne erronée sous forme d'entier.
- Indiquez la clause (sous forme de chaîne) qui, ajoutée à la clause OVER, corrige le problème.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
query = """
SELECT
ROW_NUMBER() OVER (ORDER BY time) AS row,
train_id,
station,
time,
LEAD(time,1) OVER (ORDER BY time) AS time_next
FROM schedule
"""
spark.sql(query).show()
# Give the number of the bad row as an integer
bad_row = ____
# Provide the missing clause, SQL keywords in upper case
clause = '____ ____ ____'