Selecionando linhas
Cláusulas WHERE em SQL retornam registros cujos valores atendem aos critérios definidos. Enviar essa consulta para read_sql() resulta em um dataframe carregado apenas com os registros de interesse, reduzindo a necessidade de filtragens posteriores.
A tabela hpd311calls em data.db traz dados de ligações sobre vários problemas de moradia, desde questões de manutenção até pedidos de informação. Neste exercício, você vai usar SQL para focar nas ligações sobre segurança.
O pandas já foi importado como pd, e um mecanismo de banco de dados, engine, foi criado para data.db.
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Instruções do exercício
- Crie uma consulta que selecione todas as colunas dos registros em
hpd311callsque tenham'SAFETY'comocomplaint_type. - Use
read_sql()para consultar o banco e atribua o resultado à variávelsafety_calls. - Execute a última parte do código para criar um gráfico com a contagem de ligações sobre segurança em cada bairro.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create query to get hpd311calls records about safety
query = """
____ *
____ hpd311calls
____ ____;
"""
# Query the database and assign result to safety_calls
safety_calls = ____
# Graph the number of safety calls by borough
call_counts = safety_calls.groupby('borough').unique_key.count()
call_counts.plot.barh()
plt.show()