Filtrar os registros do seu banco de dados usando SQL's WHERE
Agora você pode executar uma consulta básica em SQL para selecionar registros de qualquer tabela do seu banco de dados e também pode realizar personalizações simples de consultas para selecionar colunas e números de linhas específicos.
Há mais algumas opções de consulta padrão do SQL que ajudarão você em sua jornada para se tornar um ninja do SQL.
Digamos, por exemplo, que você queira obter todos os registros da tabela Customer
do banco de dados Chinook para os quais o Country
é 'Canada'
. Você pode fazer isso com muita facilidade em SQL usando uma instrução SELECT
seguida de uma cláusula WHERE
da seguinte forma:
SELECT * FROM Customer WHERE Country = 'Canada'
Na verdade, você pode filtrar qualquer declaração SELECT
por qualquer condição usando uma cláusula WHERE
. Isso é chamado de filtragem de seus registros.
Neste exercício interativo, você selecionará todos os registros da tabela Employee
para os quais 'EmployeeId'
é maior ou igual a 6
.
Os pacotes já estão importados da seguinte forma:
import pandas as pd
from sqlalchemy import create_engine
Você pode consultar!
Este exercício faz parte do curso
Introdução à importação de dados em Python
Instruções de exercício
- Complete o argumento de
create_engine()
para que o mecanismo do banco de dados do site SQL'Chinook.sqlite'
seja criado. - Execute a consulta que seleciona todos os registros da tabela
Employee
em que'EmployeeId'
é maior ou igual a6
. Use o operador>=
e atribua os resultados ars
. - Aplique o método
fetchall()
ars
para buscar todos os registros emrs
. Armazene-os no DataFramedf
. - Usando o objeto
rs
, defina os nomes das colunas do DataFrame com os nomes correspondentes das colunas da tabela.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Create engine: engine
engine = create_engine(____)
# Open engine in context manager
# Perform query and save results to DataFrame: df
with engine.connect() as con:
rs = con.execute(____)
df = pd.DataFrame(____)
df.columns = ____
# Print the head of the DataFrame df
print(df.head())