Spójny syntetyczny zbiór danych

Jednym z zastosowań danych syntetycznych w firmach jest trenowanie modeli sztucznej inteligencji i uczenia maszynowego. Dane rzeczywiste bywają kosztowne w zbieraniu lub po prostu trudno dostępne. Gdy dane treningowe są silnie niezbalansowane (np. ponad 90% przypadków należy do jednej klasy), generowanie danych syntetycznych może pomóc w budowaniu dokładnych modeli uczenia maszynowego.

W tym ćwiczeniu wygenerujesz zbiór danych z ocenami aplikacji mobilnej przy użyciu biblioteki Faker.

Początkowy obiekt DataFrame jest wczytany jako ratings i zawiera dwie kolumny: rating oraz gender. Generator Faker() został już zainicjalizowany jako fake_data.

Utwórz kolumnę name w obiekcie DataFrame ratings, zawierającą unikalne imiona i nazwiska odpowiadające wartościom w kolumnie gender.

ćwiczenie

Spójny syntetyczny zbiór danych

Instrukcje 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje 1/3

ćwiczenie