De diccionario a marco de datos (1)
Pandas es una biblioteca de código abierto que proporciona estructuras de datos y herramientas de análisis de datos de alto rendimiento y fáciles de usar para Python. ¡Suena prometedor!
El DataFrame es una de las estructuras de datos más importantes de Pandas. Básicamente, es una forma de almacenar datos tabulares en los que puedes etiquetar las filas y las columnas. Una forma de construir un Marco de datos es a partir de un diccionario.
En los ejercicios que siguen trabajarás con datos de vehículos de distintos países. Cada observación corresponde a un país y las columnas dan información sobre el número de vehículos per cápita, si la gente conduce por la izquierda o por la derecha, etc.
En el script se definen tres listas:
names
que contiene los nombres de los países de los que se dispone de datos.dr
una lista con booleanos que indica si la gente conduce por la izquierda o por la derecha en el país correspondiente.cpc
el número de vehículos de motor por 1000 habitantes en el país correspondiente.
Cada clave del diccionario es una etiqueta de columna y cada valor es una lista que contiene los elementos de la columna.
Este ejercicio forma parte del curso
Python intermedio
Instrucciones de ejercicio
Importa
pandas
comopd
.Utiliza las listas predefinidas para crear un diccionario llamado
my_dict
. Debe haber tres pares de clave y valor:clave
'country'
y valornames
.clave
'drives_right'
y valordr
.clave
'cars_per_cap'
y valorcpc
.
Utiliza
pd.DataFrame()
para convertir tu dict en un DataFrame llamadocars
.Imprime
cars
y verás qué bonito es.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Pre-defined lists
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr = [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]
# Import pandas as pd
# Create dictionary my_dict with three key:value pairs: my_dict
# Build a DataFrame cars from my_dict: cars
# Print cars