IniziaInizia gratis

Selezionare colonne con SQL

I dataset possono contenere colonne non necessarie all’analisi, come accade per la tabella weather in data.db. Alcune, come l’altitudine, sono ridondanti perché tutte le osservazioni sono avvenute nello stesso luogo; altre contengono variabili che non ci interessano. Dopo aver creato un motore di database, scriverai una query per SELECT solo le colonne di data e temperatura e le passerai entrambe a read_sql() per creare un dataframe con le letture di temperatura massima e minima.

pandas è stato caricato come pd e create_engine() è stato importato da sqlalchemy.

Nota: il controllo SQL è piuttosto rigido riguardo alla posizione delle colonne e si aspetta che i campi vengano selezionati nell’ordine specificato.

Questo esercizio fa parte del corso

Acquisizione dati semplificata con pandas

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un motore di database per data.db.
  • Scrivi una query SQL che esegua SELECT delle colonne date, tmax e tmin dalla tabella weather.
  • Crea un dataframe passando la query e il motore a read_sql() e assegna il dataframe risultante a temperatures.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create database engine for data.db
engine = ____

# Write query to get date, tmax, and tmin from weather
query = """
SELECT ____, 
       ____, 
       ____
  FROM ____;
"""

# Make a dataframe by passing query and engine to read_sql()
temperatures = ____

# View the resulting dataframe
print(temperatures)
Modifica ed esegui il codice