1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pośrednia analityka predykcyjna w Pythonie

Connected

ćwiczenie

Usuwanie zduplikowanych obiektów

Przyjmij, że chcesz zbudować model predykcyjny służący do wyboru darczyńców, którzy z największym prawdopodobieństwem odpowiedzą na list. Populacja tablicy bazowej powinna zawierać darczyńców, dla których dostępny jest adres i których ustawienia prywatności pozwalają na wysyłanie korespondencji. Wszyscy kandydaci na darczyńców są zapisani w ramce danych donors z trzema kolumnami: donor_id, flagą address o wartości 1, jeśli adres jest dostępny (lub 0 w przeciwnym przypadku), oraz flagą letter_allowed o wartości 1, jeśli można wysłać temu darczyńcy list (lub 0 w przeciwnym przypadku). W tym ćwiczeniu zbudujesz zbiór darczyńców, którzy powinni znaleźć się w populacji.

Instrukcje

100 XP
  • Utwórz ramkę danych donors_population zawierającą wyłącznie obserwacje, dla których adres jest dostępny i dla których wysyłka listu jest dozwolona.
  • Utwórz listę zawierającą identyfikatory darczyńców z donors_population.
  • Zbuduj finalną populację, a następnie sprawdź liczbę darczyńców w niej zawartych.