MulaiMulai sekarang secara gratis

Menyesuaikan sebaran normal

Saat bekerja dengan himpunan data yang relatif kecil, sering kali Anda tidak memiliki cukup data untuk membuat inferensi yang kuat. Namun, jika Anda menduga data mengikuti sebaran normal, masuk akal untuk menyesuaikan sebaran normal dan bekerja dengannya, alih-alih menggunakan data mentah. Dalam latihan ini Anda akan menggunakan data yang sama tentang petugas pemadam kebakaran Hispanik yang sebelumnya telah Anda tunjukkan berdistribusi normal pada taraf 5%. Anda akan menyesuaikan sebaran normal padanya, lalu menggunakannya untuk mencari persentase karyawan yang umumnya diperkirakan memiliki masa kerja kurang dari 10 tahun.

DataFrame telah dimuat untuk Anda dalam salary_df. Paket pandas sebagai pd, NumPy sebagai np, Matplotlib sebagai plt, dan paket stats dari SciPy semuanya telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Dasar-dasar Inferensi di Python

Lihat Kursus

Petunjuk latihan

  • Sesuaikan sebaran normal pada kolom Years of Employment dan simpan mean serta simpangan baku yang dihasilkan.
  • Gunakan mean dan simpangan baku ini dalam CDF normal untuk memperkirakan persentase karyawan dengan masa kerja kurang dari sepuluh tahun.
  • Cetak persentase ini.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit a normal distribution to the data
mu, std = ____

# Compute the percentage of employees with less than 10 years experience
percent = stats.____(____, loc=____, scale=____)

# Print out this percentage
____
Edit dan Jalankan Kode