Cargar un CSV en una tabla
¡Has hecho un gran trabajo insertando datos en tablas hasta ahora! Ahora vas a aprender a cargar el contenido de un archivo CSV en una tabla.
Una forma sería leer el CSV línea a línea, crear un diccionario por cada línea y luego usar insert(), como hiciste en el ejercicio anterior.
Pero hay una forma más rápida usando pandas. Puedes leer un CSV en un DataFrame con la función read_csv() (seguro que te suena; aun así, puedes ejecutar help(pd.read_csv) en la consola para refrescar la memoria). Luego, puedes llamar al método .to_sql() (docs) sobre el DataFrame para cargarlo en una tabla SQL en una base de datos. Las columnas del DataFrame deben coincidir con las columnas de la tabla SQL.
.to_sql() tiene muchos parámetros, pero en este ejercicio usaremos los siguientes:
namees el nombre de la tabla SQL (como cadena).cones la conexión a la base de datos que usarás para subir los datos.if_existsespecifica cómo actuar si la tabla ya existe en la base de datos; los valores posibles son"fail","replace"y"append".index(TrueoFalse) especifica si se escribe el índice del DataFrame como una columna.
En este ejercicio, subirás los datos del archivo census.csv a una tabla existente "census". La connection a la base de datos ya está creada para ti.
Este ejercicio forma parte del curso
Introducción a las bases de datos en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# import pandas
import pandas as pd
# read census.csv into a DataFrame : census_df
census_df = pd.___(___, ___=___)
# rename the columns of the census DataFrame
census_df.columns = [___, ___, ___, 'pop2000', 'pop2008']