Pickle'lar
Sonunda ilk modelini üretime alma zamanı. Bu, daha iyi bir alternatif üzerinde çalışmaya devam ederken başlangıç (baseline) olarak kullanacağın bir random forest sınıflandırıcısı. Eğitim/test olarak bölünmüş veriye, alışıldık adlarıyla X_train, X_test, y_train ve y_test üzerinden erişimin var. Ayrıca bu egzersizde kullanman gereken .load() ve .dump() metotlarına sahip RandomForestClassifier() ve pickle modüllerine de erişimin var.
Bu egzersiz
Python'da Machine Learning İş Akışları Tasarlama
kursunun bir parçasıdırEgzersiz talimatları
- Veriye bir random forest sınıflandırıcısı eğit. Sonuçlarının tekrarlanabilir olması için rastgele tohumu 42 olarak sabitle.
- Modeli pickle kullanarak dosyaya yaz. Hedef dosyayı
with open(____) as ____sözdizimiyle aç. - Şimdi modeli dosyadan farklı bir değişken adına,
clf_from_file, yükle. - Yüklediğin modelden aldığın tahminleri
predsadlı bir değişkende sakla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Fit a random forest to the training set
clf = ____(____=42).____(
X_train, y_train)
# Save it to a file, to be pushed to production
with ____('model.pkl', ____) as ____:
pickle.____(clf, file=file)
# Now load the model from file in the production environment
with ____ as file:
clf_from_file = pickle.____(file)
# Predict the labels of the test dataset
preds = clf_from_file.____