IniziaInizia gratis

SQL in poche parole

Man mano che vai avanti, ti sarà utile avere una comprensione di base di SQL. Un approfondimento lo trovi qui.

Una query SQL restituisce una tabella ricavata da una o più tabelle contenute in un database.

Ogni query SQL è composta da comandi che dicono al database cosa vuoi fare con i dati. I due comandi che ogni query deve contenere sono SELECT e FROM.

Dopo SELECT si indicano le colonne che vuoi nella tabella risultante.

Dopo FROM si indica il nome della tabella che contiene quelle colonne. La query SQL minima è:

SELECT * FROM my_table;

L'* seleziona tutte le colonne, quindi questo restituisce l'intera tabella chiamata my_table.

Come con .withColumn(), puoi fare calcoli per colonna all'interno di un'istruzione SELECT. Per esempio,

SELECT origin, dest, air_time / 60 FROM flights;

restituisce una tabella con origine, destinazione e durata in ore per ogni volo.

Un altro comando usato spesso è WHERE. Questo comando filtra le righe della tabella in base a una condizione logica che specifichi. La tabella risultante contiene le righe per cui la tua condizione è vera. Per esempio, se avessi una tabella di studenti e voti potresti fare:

SELECT * FROM students
WHERE grade = 'A';

per selezionare tutte le colonne e le righe contenenti le informazioni sugli studenti che hanno preso A.

Quale delle seguenti query restituisce una tabella con numeri di coda e destinazioni per i voli che sono durati più di 10 ore?

Questo esercizio fa parte del corso

Fondamenti di PySpark

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio