ComeçarComece de graça

Selecionando colunas com SQL

Conjuntos de dados podem ter colunas que não são necessárias para a análise, como acontece com a tabela weather em data.db. Algumas, como a elevação, são redundantes, já que todas as observações ocorreram no mesmo lugar; outras trazem variáveis que não interessam. Depois de criar um mecanismo de banco de dados, você vai escrever uma consulta para SELECT apenas as colunas de data e temperatura e passá-la para read_sql() para criar um dataframe com as leituras de temperaturas máxima e mínima.

pandas já foi carregado como pd, e create_engine() foi importado de sqlalchemy.

Observação: O validador de SQL é bem rigoroso com a posição das colunas e espera que os campos sejam selecionados na ordem especificada.

Este exercício faz parte do curso

Ingestão de dados simplificada com pandas

Ver curso

Instruções do exercício

  • Crie um mecanismo de banco de dados para data.db.
  • Escreva uma consulta SQL que faça SELECT das colunas date, tmax e tmin da tabela weather.
  • Crie um dataframe passando a consulta e o mecanismo para read_sql() e atribua o dataframe resultante a temperatures.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create database engine for data.db
engine = ____

# Write query to get date, tmax, and tmin from weather
query = """
SELECT ____, 
       ____, 
       ____
  FROM ____;
"""

# Make a dataframe by passing query and engine to read_sql()
temperatures = ____

# View the resulting dataframe
print(temperatures)
Editar e executar o código