Selecionando colunas com SQL
Conjuntos de dados podem ter colunas que não são necessárias para a análise, como acontece com a tabela weather em data.db. Algumas, como a elevação, são redundantes, já que todas as observações ocorreram no mesmo lugar; outras trazem variáveis que não interessam. Depois de criar um mecanismo de banco de dados, você vai escrever uma consulta para SELECT apenas as colunas de data e temperatura e passá-la para read_sql() para criar um dataframe com as leituras de temperaturas máxima e mínima.
pandas já foi carregado como pd, e create_engine() foi importado de sqlalchemy.
Observação: O validador de SQL é bem rigoroso com a posição das colunas e espera que os campos sejam selecionados na ordem especificada.
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Instruções do exercício
- Crie um mecanismo de banco de dados para
data.db. - Escreva uma consulta SQL que faça
SELECTdas colunasdate,tmaxetminda tabelaweather. - Crie um dataframe passando a consulta e o mecanismo para
read_sql()e atribua o dataframe resultante atemperatures.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create database engine for data.db
engine = ____
# Write query to get date, tmax, and tmin from weather
query = """
SELECT ____,
____,
____
FROM ____;
"""
# Make a dataframe by passing query and engine to read_sql()
temperatures = ____
# View the resulting dataframe
print(temperatures)