Aan de slagBegin gratis

Repareer de kapotte query

Deze query voert correct uit, maar geeft in één van de rijen een onjuist resultaat door een weglating in de OVER-clausule. Kun je de bug vinden? Kun je de query aanpassen zodat hij een logisch resultaat geeft?

Deze oefening maakt deel uit van de cursus

Introductie tot Spark SQL in Python

Bekijk cursus

Oefeninstructies

  • Geef het rijnummer van de foutieve rij als een geheel getal.
  • Geef de clausule (als string) die, wanneer toegevoegd aan de OVER-clausule, het probleem oplost.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

query = """
SELECT 
ROW_NUMBER() OVER (ORDER BY time) AS row,
train_id, 
station, 
time, 
LEAD(time,1) OVER (ORDER BY time) AS time_next 
FROM schedule
"""
spark.sql(query).show()

# Give the number of the bad row as an integer
bad_row = ____

# Provide the missing clause, SQL keywords in upper case
clause = '____ ____ ____'
Code bewerken en uitvoeren