1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pośrednia analityka predykcyjna w Pythonie

Connected

ćwiczenie

Bezwzględna różnica między dwoma latami

Kolejną zmienną, którą warto dodać, jest bezwzględna różnica między liczbą darowizn przekazanych w ostatnim roku (2017) a liczbą darowizn z roku poprzedniego (2016). Aby dodać tę zmienną do basetable, przygotowano dla ciebie dwie ramki danych pandas – gifts_2016 i gifts_2017 – zawierające odpowiednio darowizny z 2016 i 2017 roku.

Przypomnij sobie, że możesz zliczyć wystąpienia w ramce danych pandas df dla każdego identyfikatora w kolumnie id przy użyciu funkcji groupby:

df_grouped = df.groupby("id")["value"].count().reset_index()

oraz że lewe złączenie dwóch ramek danych df1 i df2 po kolumnie merge_id wykonujesz za pomocą poniższego kodu:

merged_df = pd.merge(df1, df2, on=["merge_id"], how="left")

Instrukcje

100 XP
  • Oblicz dla każdego darczyńcy w gifts_2016 liczbę darowizn przekazanych w 2016 roku.
  • Oblicz dla każdego darczyńcy w gifts_2017 liczbę darowizn przekazanych w 2017 roku.
  • Dodaj liczbę darowizn z 2016 i 2017 roku do basetable.
  • Oblicz różnicę między liczbą darowizn z 2017 i 2016 roku i dodaj ją do basetable.