1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Myślenie statystyczne w Pythonie (część 1)

Connected

cvičení

Rysowanie histogramu danych iris

W ćwiczeniach tej sekcji będziesz korzystać z klasycznego zbioru danych zebranego przez botanika Edwarda Andersona, który zasłynął dzięki Ronaldowi Fisherowi – jednemu z najbardziej płodnych statystyków w historii. Anderson skrupulatnie zmierzył właściwości anatomiczne próbek trzech gatunków irysów: Iris setosa, Iris versicolor i Iris virginica. Pełny zbiór danych jest dostępny w bibliotece scikit-learn. Tutaj skupisz się na pomiarach długości płatków.

Narysuj histogram długości płatków 50 próbek Iris versicolor, korzystając z domyślnych ustawień matplotlib/seaborn. Pamiętaj, że domyślny styl seaborn możesz ustawić za pomocą sns.set(), gdzie sns to alias, pod którym importowana jest biblioteka seaborn.

Fragment zbioru danych zawierający długości płatków Iris versicolor w centymetrach (cm) jest przechowywany w tablicy NumPy versicolor_petal_length.

W filmie Justin rysował histogramy, korzystając z biblioteki pandas i indeksując DataFrame w celu wyodrębnienia odpowiedniej kolumny. Tutaj wystarczy użyć dostarczonej tablicy NumPy. Poza tym Justin przypisywał instrukcje rysowania (z wyjątkiem plt.show()) do zmiennej zastępczej _, aby uniknąć zbędnych wyników na wyjściu. Nie jest to wymagane w twoich rozwiązaniach, ale warto stosować tę praktykę. Alternatywnie, jeśli pracujesz w środowisku interaktywnym, takim jak Jupyter Notebook, możesz po instrukcjach rysowania dodać ;, aby uzyskać ten sam efekt. Justin preferuje jednak _ – dlatego zobaczysz je w kodzie rozwiązania.

Pokyny

100 XP
  • Zaimportuj matplotlib.pyplot i seaborn pod ich standardowymi aliasami (plt i sns).
  • Użyj biblioteki seaborn, aby ustawić domyślne style wykresów.
  • Narysuj histogram długości płatków Iris versicolor za pomocą plt.hist() i dostarczonej tablicy NumPy versicolor_petal_length.
  • Wyświetl histogram za pomocą plt.show().