ComeçarComece de graça

EDA de dados de alfabetização/fertilidade

Nos próximos exercícios, vamos analisar a correlação entre alfabetização feminina e fertilidade (definida como o número médio de filhos por mulher) ao redor do mundo. Para facilitar a análise e a interpretação, vamos trabalhar com a taxa de analfabetismo.

Sempre vale a pena fazer um pouco de EDA antes da análise. Para isso, trace o gráfico de fertilidade versus analfabetismo e calcule o coeficiente de correlação de Pearson. O array do NumPy illiteracy contém a taxa de analfabetismo entre mulheres para a maioria dos países do mundo. O array fertility contém os dados correspondentes de fertilidade.

Aqui, pode ser útil revisar a função que você escreveu no curso anterior para calcular o coeficiente de correlação de Pearson.

Este exercício faz parte do curso

Pensamento Estatístico em Python (Parte 2)

Ver curso

Instruções do exercício

  • Plote fertility (eixo y) versus illiteracy (eixo x) como um gráfico de dispersão.
  • Defina uma margem de 2%.
  • Calcule e imprima o coeficiente de correlação de Pearson entre illiteracy e fertility.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Plot the illiteracy rate versus fertility
_ = plt.plot(____, ____, ____='.', ____='none')

# Set the margins and label axes
plt.margins(____)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')

# Show the plot
plt.show()

# Show the Pearson correlation coefficient
print(pearson_r(____, ____))
Editar e executar o código