CommencerCommencez gratuitement

Créer une table SQL à partir d’un dataframe

Un dataframe peut être utilisé pour créer une table temporaire. Une table temporaire n’existe plus une fois la session terminée. La documentation Spark appelle aussi ce type de table une vue SQL temporaire. Dans la documentation, on parle de registrer le dataframe comme une vue SQL temporaire. Cette commande s’applique directement au dataframe ; elle crée la table si elle n’existe pas encore, ou la remplace par les données actuelles du dataframe si elle existe déjà.

Cet exercice fait partie du cours

<cours>Introduction à Spark SQL en Python</cours>
Voir le cours

Instructions de l’exercice

  • Chargez des données CSV depuis le fichier trainsched.txt dans un dataframe stocké dans une variable nommée df.
  • Créez une table temporaire à partir de df. Nommez la table « table1 ».

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Load trainsched.txt
df = spark.____.____("trainsched.txt", header=True)

# Create temporary table called table1
df.____(____)
Modifier et exécuter le code