1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Manipulowanie danymi z dplyr

Connected

Exercise

Dodawanie sumy i maksimum dla każdego imienia

W lekcji wideo zobaczyłeś(-aś), jak grupować dane według roku i używać mutate(), aby dodać sumę dla danego roku.

W tych ćwiczeniach nauczysz się normalizować dane według innej, równie interesującej miary: podzielisz liczbę wystąpień każdego imienia przez maksimum dla tego imienia. Oznacza to, że każde imię osiągnie szczyt na poziomie 1.

Po dodaniu nowych kolumn wynik nadal będzie pogrupowany według imienia. Tworzy to 48 000 grup, co w praktyce spowalnia późniejsze operacje, takie jak mutate.

Instrukcje 1/2

undefined XP
    1
    2
  • Użyj grupowanego mutate, aby dodać dwie kolumny:
    • name_total: suma liczby dzieci urodzonych z danym imieniem w całym zbiorze danych.
    • name_max: maksymalna liczba dzieci urodzonych z danym imieniem w dowolnym roku.