Crea una tabella SQL da un dataframe
Un dataframe può essere usato per creare una tabella temporanea. Una tabella temporanea è una tabella che non esisterà più al termine della sessione. La documentazione di Spark si riferisce a questo tipo di tabella anche come SQL temporary view. Nella documentazione questo viene descritto come registrare il dataframe come SQL temporary view. Questo comando viene chiamato direttamente sul dataframe e crea una tabella se non esiste già, sostituendola con i dati correnti del dataframe se esiste già.
Questo esercizio fa parte del corso
Introduzione a Spark SQL in Python
Istruzioni dell'esercizio
- Carica i dati CSV dal file
trainsched.txtin un dataframe e salvalo in una variabile chiamatadf. - Crea da
dfuna tabella temporanea. Chiama la tabella "table1".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load trainsched.txt
df = spark.____.____("trainsched.txt", header=True)
# Create temporary table called table1
df.____(____)