1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do Spark z pakietem sparklyr w R

Connected

ćwiczenie

Hej, co to za dźwięk?

Utwory muzyczne to z natury coś analogowego – dźwięk to nic innego jak drgania powietrza. Żeby przeanalizować piosenkę, trzeba ją jednak zamienić na liczby. Każdy utwór w zbiorze danych Million Song Dataset zawiera dwanaście pomiarów barwy dźwięku, wykonanych w regularnych odstępach czasu. (Barwa dźwięku opisuje postrzeganą jakość dźwięku – pozwala na przykład odróżnić głosy od instrumentów smyczkowych czy perkusji.)

W tym rozdziale spróbujesz przewidzieć rok wydania utworu na podstawie jego barwy dźwięku. Innymi słowy, wykorzystasz te pomiary do wygenerowania cech dla modeli. (Przypomnij sobie, że cecha w uczeniu maszynowym to zmienna wejściowa modelu – w statystyce często nazywana zmienną objaśniającą.)

Dane o barwie dźwięku mają postać macierzy: wiersze odpowiadają kolejnym punktom czasowym, a kolumny – poszczególnym rodzajom pomiarów. Wszystkie macierze mają zatem dwanaście kolumn, ale liczba wierszy różni się w zależności od długości utworu. Średnia każdej kolumny szacuje przeciętną wartość danego pomiaru dla całego utworu. W ten sposób można wygenerować dwanaście cech dla modelu.

Instrukcje

100 XP

W twoim środowisku pracy została wcześniej zdefiniowana zmienna timbre, zawierająca pomiary barwy dźwięku dla utworu "Poker Face" Lady Gagi.

  • Użyj funkcji colMeans(), aby obliczyć średnie kolumnowe macierzy timbre. Wynik przypisz do zmiennej mean_timbre.