Crie uma tabela SQL a partir de um dataframe
Um dataframe pode ser usado para criar uma tabela temporária. Uma tabela temporária é aquela que não existe após o fim da sessão. A documentação do Spark também se refere a esse tipo de tabela como uma visualização temporária SQL. Na documentação, isso é referido como registrar o dataframe como uma visualização temporária SQL. Esse comando é chamado no próprio dataframe e cria uma tabela caso ela ainda não exista, substituindo-a pelos dados atuais do dataframe se ela já existir.
Este exercício faz parte do curso
Introdução ao Spark SQL em Python
Instruções do exercício
- Carregue dados CSV do arquivo
trainsched.txtem um dataframe armazenado na variáveldf. - Crie uma tabela temporária a partir de
df. Dê a essa tabela o nome "table1".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load trainsched.txt
df = spark.____.____("trainsched.txt", header=True)
# Create temporary table called table1
df.____(____)