ComenzarEmpieza gratis

Cargar un CSV en una tabla

¡Has hecho un gran trabajo insertando datos en tablas hasta ahora! Ahora vas a aprender a cargar el contenido de un archivo CSV en una tabla.

Una forma sería leer el CSV línea a línea, crear un diccionario por cada línea y luego usar insert(), como hiciste en el ejercicio anterior.

Pero hay una forma más rápida usando pandas. Puedes leer un CSV en un DataFrame con la función read_csv() (seguro que te suena; aun así, puedes ejecutar help(pd.read_csv) en la consola para refrescar la memoria). Luego, puedes llamar al método .to_sql() (docs) sobre el DataFrame para cargarlo en una tabla SQL en una base de datos. Las columnas del DataFrame deben coincidir con las columnas de la tabla SQL.

.to_sql() tiene muchos parámetros, pero en este ejercicio usaremos los siguientes:

  • name es el nombre de la tabla SQL (como cadena).
  • con es la conexión a la base de datos que usarás para subir los datos.
  • if_exists especifica cómo actuar si la tabla ya existe en la base de datos; los valores posibles son "fail", "replace" y "append".
  • index (True o False) especifica si se escribe el índice del DataFrame como una columna.

En este ejercicio, subirás los datos del archivo census.csv a una tabla existente "census". La connection a la base de datos ya está creada para ti.

Este ejercicio forma parte del curso

Introducción a las bases de datos en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# import pandas
import pandas as pd

# read census.csv into a DataFrame : census_df
census_df = pd.___(___, ___=___)

# rename the columns of the census DataFrame
census_df.columns = [___, ___, ___, 'pop2000', 'pop2008']
Editar y ejecutar código