1. Обучение
  2. /
  3. Курса
  4. /
  5. Parallel Programming with Dask in Python

Connected

упражнение

Trénování lineárního modelu pomocí Dask

Dask umožňuje trénovat modely strojového učení na datasetech, které se nevejdou do paměti, a zároveň ti dovoluje rozložit načítání dat, předzpracování i trénování napříč více vlákny, procesy nebo dokonce více počítači.

Tvým úkolem je natrénovat model strojového učení, který bude předpovídat popularitu skladeb v datové sadě Spotify, se kterou jsi pracoval/a v předchozích kapitolách. Data jsou již načtena jako lazy Dask DataFramy. Vstupní proměnné jsou dostupné jako dask_X a obsahují několik numerických sloupců, například tempo skladby a její taneční potenciál. Cílové hodnoty jsou dostupné jako dask_y a představují skóre popularity každé skladby.

Инструкции

100 XP
  • Importuj třídu SGDRegressor z sklearn.linear_model a třídu Incremental z dask_ml.wrappers.
  • Vytvoř model lineární regrese SGDRegressor.
  • Pomocí třídy Incremental zabal model tak, aby bylo možné ho trénovat s Dask datasetem, a nastav parametr scoring na 'neg_mean_squared_error'.
  • Natrénuj zabalený model s jedním průchodem přes data.