ComenzarEmpieza gratis

Seleccionar columnas con SQL

Los conjuntos de datos pueden tener columnas que no hacen falta para un análisis, como ocurre con la tabla weather en data.db. Algunas, como la elevación, son redundantes porque todas las observaciones se tomaron en el mismo lugar, mientras que otras contienen variables que no nos interesan. Tras crear un motor de base de datos, escribirás una consulta para SELECT solo las columnas de fecha y temperatura, y pasarás ambas a read_sql() para crear un dataframe con las lecturas de temperaturas máximas y mínimas.

Se ha cargado pandas como pd, y create_engine() se ha importado de sqlalchemy.

Nota: El validador de SQL es muy estricto con la posición de las columnas y espera que los campos se seleccionen en el orden especificado.

Este ejercicio forma parte del curso

Ingesta de datos eficiente con pandas

Ver curso

Instrucciones del ejercicio

  • Crea un motor de base de datos para data.db.
  • Escribe una consulta SQL que haga SELECT de las columnas date, tmax y tmin de la tabla weather.
  • Crea un dataframe pasando la consulta y el motor a read_sql() y asigna el dataframe resultante a temperatures.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create database engine for data.db
engine = ____

# Write query to get date, tmax, and tmin from weather
query = """
SELECT ____, 
       ____, 
       ____
  FROM ____;
"""

# Make a dataframe by passing query and engine to read_sql()
temperatures = ____

# View the resulting dataframe
print(temperatures)
Editar y ejecutar código