Seleccionar columnas con SQL
Los conjuntos de datos pueden tener columnas que no hacen falta para un análisis, como ocurre con la tabla weather en data.db. Algunas, como la elevación, son redundantes porque todas las observaciones se tomaron en el mismo lugar, mientras que otras contienen variables que no nos interesan. Tras crear un motor de base de datos, escribirás una consulta para SELECT solo las columnas de fecha y temperatura, y pasarás ambas a read_sql() para crear un dataframe con las lecturas de temperaturas máximas y mínimas.
Se ha cargado pandas como pd, y create_engine() se ha importado de sqlalchemy.
Nota: El validador de SQL es muy estricto con la posición de las columnas y espera que los campos se seleccionen en el orden especificado.
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Instrucciones del ejercicio
- Crea un motor de base de datos para
data.db. - Escribe una consulta SQL que haga
SELECTde las columnasdate,tmaxytminde la tablaweather. - Crea un dataframe pasando la consulta y el motor a
read_sql()y asigna el dataframe resultante atemperatures.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create database engine for data.db
engine = ____
# Write query to get date, tmax, and tmin from weather
query = """
SELECT ____,
____,
____
FROM ____;
"""
# Make a dataframe by passing query and engine to read_sql()
temperatures = ____
# View the resulting dataframe
print(temperatures)