Introdução rápida ao SQL
À medida que você for avançando, será útil ter conhecimentos básicos de SQL. Você encontra uma análise mais detalhada aqui.
Uma consulta SQL retorna uma tabela derivada de uma ou mais tabelas contidas em um banco de dados.
Toda consulta SQL é composta de comandos que informam ao banco de dados o que você deseja fazer com os dados. Os dois comandos que toda consulta deve conter são SELECT
e FROM
.
O comando SELECT
é seguido das colunas que você deseja na tabela resultante.
O comando FROM
é seguido do nome da tabela que contém essas colunas. A consulta SQL mais simples é:
SELECT * FROM my_table;
O *
seleciona todas as colunas, portanto isso retorna a tabela inteira chamada my_table
.
Assim como o .withColumn()
, você pode fazer cálculos com colunas em uma instrução SELECT
. Por exemplo:
SELECT origin, dest, air_time / 60 FROM flights;
retorna uma tabela com a origem, o destino e a duração em horas de cada voo.
Outro comando comumente usado é WHERE
. Esse comando filtra as linhas da tabela com base em alguma condição lógica que você especificar. A tabela resultante contém as linhas em que sua condição é verdadeira. Por exemplo, se você tivesse uma tabela de alunos e notas, poderia fazer isso:
SELECT * FROM students
WHERE grade = 'A';
para selecionar todas as colunas e linhas que contêm informações sobre os alunos que tiraram A.
Qual das seguintes consultas retorna uma tabela de matrículas de identificação (tail numbers) e destinos referentes a voos com duração de mais de 10 horas?
Este exercício faz parte do curso
Introdução ao PySpark
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
