Popularidad de los productos vendidos por estado

El conjunto de datos de mercados de agricultores incluye columnas para 28 productos distintos e indica si se venden o no en cada mercado. Te gustaría ver si hay historias interesantes sobre cuán probable es encontrar un determinado producto en los mercados de cada estado. Para responder a esta pregunta, reduces los datos a tres columnas:

state - el nombre del estado
good - el producto de interés
prop_selling - la proporción de mercados de ese estado que venden ese producto

Para ver rápidamente si emergen patrones, eliges un subconjunto de productos interesantes y decides crear un simple gráfico de texto disperso: el producto en el eje x y la proporción de mercados del estado que venden ese producto en el eje y.

Este ejercicio forma parte del curso

Mejora tus visualizaciones de datos en Python

Ver curso

Instrucciones del ejercicio

Filtra goods_by_state a los productos deseados listados en to_plot.
Oculta los puntos del diagrama de dispersión estableciendo su tamaño a nada.
- Ten en cuenta que en sns.scatterplot(), size se usa para mapear valores de una columna a una escala de tamaños, y s se usa para fijar un tamaño constante para todos los puntos.
Alinea el texto al centro para que quede directamente en la posición del producto sobre el eje x.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Subset goods to interesting ones
to_plot = ['Cheese','Maple','Fruits','Grains','Seafood','Plants','Vegetables']
goods_by_state_small = goods_by_state.____("good in "+str(to_plot))

g = sns.scatterplot('good','prop_selling', data = goods_by_state_small,
                    # Hide scatter points by shrinking to nothing
                    ____ = ____)

for _,row in goods_by_state_small.iterrows():
  g.annotate(row['state'], (row['good'], row['prop_selling']), 
             # Center annotation on axis
             ha = '____', 
             size = 10)

plt.show()

Editar y ejecutar código