Veriyi birden fazla cihaza bölerek ve modeli her cihaza kopyalayarak dağıtık eğitim için hazırlayacaksın. Accelerator, veri hazırlama için kullanışlı bir arayüz sunar; dağıtık eğitimin ilk adımı olarak görüntü, ses ve metni nasıl ön işleyeceğini öğreneceksin.

AutoModel ve Accelerator ile modelleri hazırla

Önceden eğitilmiş modelleri yükleme ve inceleme

Accelerator ile otomatik aygıt yerleştirme

Eğitim için görüntü ve sesleri ön işlemeden geçir

Görüntü veri kümelerini ön işleme

Ses veri kümelerini ön işleme

Dağıtık eğitim için veri kümelerini hazırla

Eğitim için metni ön işle

AutoTokenizer ile metni ön işle

Ön işlenmiş metnin durumunu kaydet ve yükle

Accelerator ile Veri Hazırlama

Dağıtık eğitimde her cihaz kendi verisiyle paralel olarak eğitim yapar. Dağıtık eğitim için iki yöntemi inceleyeceksin: Accelerator özel eğitim döngülerine imkân tanır, Trainer ise eğitim arayüzünü basitleştirir.

Trainer ile modelleri ince ayarla

Değerlendirme metriklerini tanımla

TrainingArguments değerlerini belirt

Trainer'ı ayarla

Accelerator ile modelleri eğit

Bir modeli dağıtık eğitime hazırla

Accelerator'dan önce ve sonra eğitim döngüleri

Accelerator ile bir eğitim döngüsü kurma

Modelleri Accelerator ile değerlendir

Modeli değerlendirme moduna alma

Değerlendirme metriklerini kaydetme

Accelerator ve Trainer ile Dağıtık Eğitim

Büyük modeller ve veri kümeleri, dağıtık eğitimde kaynakları zorlayabilir; ancak bellek kullanımını, cihazlar arası iletişimi ve hesaplama verimliliğini iyileştirerek bu zorlukların üstesinden gelebilirsin. Gradyan biriktirme, gradyan checkpointing, yerel stokastik gradyan inişi ve karışık duyarlıklı eğitim tekniklerini keşfedeceksin.

Gradyan biriktirme

Accelerator ile gradyan biriktirme

Trainer ile gradyan biriktirme

Gradient checkpointing ve yerel SGD

Accelerator ile gradyan kontrol noktalama

Trainer ile gradient checkpointing

Accelerator ile Yerel SGD

Karma hassasiyetli eğitim

Temel PyTorch ile karma hassasiyetli eğitim

Accelerator ile karma hassasiyetli eğitim

Trainer ile karma hassasiyetli eğitim

Eğitim Verimliliğini Artırma

Dağıtık eğitim verimliliğini artırmak için optimize edicilere odaklanacak, AdamW, Adafactor ve 8-bit Adam arasındaki ödünleşimleri vurgulayacaksın. Parametre sayısını azaltmak veya düşük duyarlık kullanmak, bir modelin bellek ayak izini küçültmeye yardımcı olur.

AdamW ile dengeli eğitim

Trainer ile AdamW

Accelerator ile AdamW

Optimize edici boyutunu hesapla

Adafactor ile bellek açısından verimli eğitim

Trainer ile Adafactor

Accelerator ile Adafactor

8-bit Adam ile karışık duyarlıkta eğitim

8-bit Adam eniyileyicisini kur

Trainer ile 8-bit Adam

Accelerator ile 8-bit Adam

Seçenekler

AdamW

Adafactor

8-bit Adam

Hangi optimize edici?

Tebrikler!

Verimli Optimize Edicilerle Eğitim

Audio dataset

Crop image

Agricultural QA dataset

MRPC dataset

Machine Learning modellerinin çok daha kısa sürede eğitilmesini ister misin? Dağıtık eğitim, modelleri birden fazla cihazda aynı anda eğitmeni sağlar; böylece AI projelerini ölçekleyip eğitim sürelerini kısaltabilirsin. Bu derste, cihazında dağıtık eğitime hazırlık için Hugging Face Accelerator kütüphanesini ve PyTorch'u nasıl kullanacağını öğreneceksin. Görüntü, metin veya ses modelleri üzerinde çalışırken bu teknikleri gerçek iş akışlarına uygulama konusunda pratik deneyim kazanırken veri parçalama, model kopyalama ve parametre senkronizasyonunu keşfedeceksin.

Dağıtık eğitim, büyük ölçekli makine öğrenmesinde temel bir beceridir ve trilyonlarca parametreye sahip büyük dil modellerini eğitmek için gereken süreyi azaltmanıza yardımcı olur. Bu kursta, PyTorch, Accelerator ve Trainer kullanarak verimli dağıtık eğitim için gerekli araçları, teknikleri ve stratejileri keşfedeceksiniz. 
<h2>Dağıtık Eğitim İçin Verileri Hazırlama</h2>
Dağıtık eğitim için verileri hazırlamaya, veri kümelerini birden fazla cihaza bölerek ve model kopyalarını her cihaza dağıtarak başlayacaksınız. Dağıtık ortamlar için verileri ön işleme konusunda uygulamalı deneyim kazanacaksınız; buna görüntüler, ses ve metin de dahildir.
<h2>Verimlilik Tekniklerini Keşfetmek</h2>
Verileriniz hazır olduğunda, birden fazla arayüzde eğitim ve optimizer kullanımında verimliliği artırmanın yollarını keşfedeceksiniz. Bu zorlukların üstesinden, gradient accumulation, gradient checkpointing, local stochastic gradient descent ve mixed precision training gibi tekniklerle bellek kullanımını, cihaz iletişimini ve hesaplama verimliliğini iyileştirerek nasıl geleceğinizi göreceksiniz. Farklı optimizasyon algoritmaları arasındaki ödünleşimleri anlayarak modelinizin bellek kullanımını azaltmanıza yardımcı olacaksınız.

Bu kursun sonunda, dağıtık yapay zekâ destekli hizmetler oluşturmak için gerekli bilgi ve araçlarla donatılmış olacaksınız.

Intermediate Deep Learning with PyTorch

Working with Hugging Face

Accelerator ve Trainer ile büyük dil modellerinin eğitim süresini azaltmayı öğrenin.

PyTorch ile Verimli AI Model Eğitimi

Accelerator ve Trainer ile dağıtık eğitimde büyük dil modellerinin eğitim sürelerini nasıl azaltacağınızı öğrenin

Tebrikler!

Create Your Free Account