Selezionare colonne con SQL
I dataset possono contenere colonne non necessarie all’analisi, come accade per la tabella weather in data.db. Alcune, come l’altitudine, sono ridondanti perché tutte le osservazioni sono avvenute nello stesso luogo; altre contengono variabili che non ci interessano. Dopo aver creato un motore di database, scriverai una query per SELECT solo le colonne di data e temperatura e le passerai entrambe a read_sql() per creare un dataframe con le letture di temperatura massima e minima.
pandas è stato caricato come pd e create_engine() è stato importato da sqlalchemy.
Nota: il controllo SQL è piuttosto rigido riguardo alla posizione delle colonne e si aspetta che i campi vengano selezionati nell’ordine specificato.
Questo esercizio fa parte del corso
Acquisizione dati semplificata con pandas
Istruzioni dell'esercizio
- Crea un motore di database per
data.db. - Scrivi una query SQL che esegua
SELECTdelle colonnedate,tmaxetmindalla tabellaweather. - Crea un dataframe passando la query e il motore a
read_sql()e assegna il dataframe risultante atemperatures.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create database engine for data.db
engine = ____
# Write query to get date, tmax, and tmin from weather
query = """
SELECT ____,
____,
____
FROM ____;
"""
# Make a dataframe by passing query and engine to read_sql()
temperatures = ____
# View the resulting dataframe
print(temperatures)