EDA de dados de alfabetização/fertilidade
Nos próximos exercícios, vamos analisar a correlação entre alfabetização feminina e fertilidade (definida como o número médio de filhos por mulher) ao redor do mundo. Para facilitar a análise e a interpretação, vamos trabalhar com a taxa de analfabetismo.
Sempre vale a pena fazer um pouco de EDA antes da análise. Para isso, trace o gráfico de fertilidade versus analfabetismo e calcule o coeficiente de correlação de Pearson. O array do NumPy illiteracy contém a taxa de analfabetismo entre mulheres para a maioria dos países do mundo. O array fertility contém os dados correspondentes de fertilidade.
Aqui, pode ser útil revisar a função que você escreveu no curso anterior para calcular o coeficiente de correlação de Pearson.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Plote
fertility(eixo y) versusilliteracy(eixo x) como um gráfico de dispersão. - Defina uma margem de 2%.
- Calcule e imprima o coeficiente de correlação de Pearson entre
illiteracyefertility.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the illiteracy rate versus fertility
_ = plt.plot(____, ____, ____='.', ____='none')
# Set the margins and label axes
plt.margins(____)
_ = plt.xlabel('percent illiterate')
_ = plt.ylabel('fertility')
# Show the plot
plt.show()
# Show the Pearson correlation coefficient
print(pearson_r(____, ____))