Popularidad de los productos vendidos por estado
El conjunto de datos de mercados de agricultores incluye columnas para 28 productos distintos e indica si se venden o no en cada mercado. Te gustaría ver si hay historias interesantes sobre cuán probable es encontrar un determinado producto en los mercados de cada estado. Para responder a esta pregunta, reduces los datos a tres columnas:
state- el nombre del estadogood- el producto de interésprop_selling- la proporción de mercados de ese estado que venden ese producto
Para ver rápidamente si emergen patrones, eliges un subconjunto de productos interesantes y decides crear un simple gráfico de texto disperso: el producto en el eje x y la proporción de mercados del estado que venden ese producto en el eje y.
Este ejercicio forma parte del curso
Mejora tus visualizaciones de datos en Python
Instrucciones del ejercicio
Filtra
goods_by_statea los productos deseados listados ento_plot.Oculta los puntos del diagrama de dispersión estableciendo su tamaño a nada.
- Ten en cuenta que en
sns.scatterplot(),sizese usa para mapear valores de una columna a una escala de tamaños, ysse usa para fijar un tamaño constante para todos los puntos.
- Ten en cuenta que en
Alinea el texto al centro para que quede directamente en la posición del producto sobre el eje x.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Subset goods to interesting ones
to_plot = ['Cheese','Maple','Fruits','Grains','Seafood','Plants','Vegetables']
goods_by_state_small = goods_by_state.____("good in "+str(to_plot))
g = sns.scatterplot('good','prop_selling', data = goods_by_state_small,
# Hide scatter points by shrinking to nothing
____ = ____)
for _,row in goods_by_state_small.iterrows():
g.annotate(row['state'], (row['good'], row['prop_selling']),
# Center annotation on axis
ha = '____',
size = 10)
plt.show()