Filtrando os registros do seu banco de dados usando SQL WHERE
Agora você já sabe executar uma consulta SQL básica para selecionar registros de qualquer tabela do seu banco de dados e também pode fazer pequenas personalizações na consulta para selecionar colunas específicas e um determinado número de linhas.
Existem mais algumas técnicas básicas de consulta SQL que vão te ajudar na tua jornada para te tornares um ninja do SQL.
Digamos, por exemplo, que você queira obter todos os registros da tabela Customer do banco de dados Chinook para os quais o Country é 'Canada'. Você pode fazer isso facilmente no SQL usando umaSELECTinstrução seguida de umaWHEREcláusula, da seguinte forma:
SELECT * FROM Customer WHERE Country = 'Canada'
Na verdade, você pode filtrar qualquer instrução SELECT por qualquer condição usando uma cláusula WHERE. Isso é chamado de filtragem de registros.
Neste exercício interativo, você selecionará todos os registros da tabela Employee em que 'EmployeeId' é maior ou igual a 6.
Os pacotes já estão importados da seguinte forma:
import pandas as pd
from sqlalchemy import create_engine
Consulte à vontade!
Este exercício faz parte do curso
Introdução à importação de dados em Python
Instruções do exercício
- Preencha o argumento de
create_engine()para que o mecanismo da base de dados SQLite'Chinook.sqlite'seja criado. - Execute a consulta que seleciona todos os registros da tabela
Employeeonde'EmployeeId'é maior ou igual a6. Use o operador>=e atribua os resultados ars. - Aplique o método
fetchall()arspara buscar todos os registros emrs. Armazene-os no DataFramedf. - Usando o objeto
rs, defina os nomes das colunas do DataFrame com os nomes correspondentes das colunas da tabela.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create engine: engine
engine = create_engine(____)
# Open engine in context manager
# Perform query and save results to DataFrame: df
with engine.connect() as con:
rs = con.execute(____)
df = pd.DataFrame(____)
df.columns = ____
# Print the head of the DataFrame df
print(df.head())