or
Bu egzersiz, kursun bir parçasıdır
Bu bölüm, Machine Learning’de veri sürümlendirmesi için temel bir araç olan Data Version Control (DVC)’e kapsamlı bir giriş sunar. Öğrenenler veri sürümlendirmenin ardındaki motivasyonu keşfedecek, kod sürümlendirmeden farklarını anlayacak ve basit bir sınıflandırma problemi üzerinde denemeler yapacak. Temel Git komutlarını gözden geçirecek, DVC hakkında bilgi edinecek ve bir depo kurmayı pratik edecekler. Bölüm, verilerin ve modellerin sürümlendirilmesi, Machine Learning için CI/CD, deney takibi, boru hatları ve daha fazlası dahil DVC’nin özellikleri ve kullanım alanlarına genel bir bakışla sona erer.
Bu bölüm, DVC’nin kurulumuna derinlemesine iner; yükleme, depo başlatma ve .dvcignore dosyasının kullanımı gibi konuları kapsar. Ayrıca DVC önbelleği ve hazırlık (staging) dosyalarının incelenmesi üzerinden dosya ekleme ve kaldırma, önbellekleri yönetme ve MD5 karma (hash) kullanılarak alttaki işleyişi anlama konularında bilgi verir. Bölüm, DVC uzak depolarını Git uzak depolarından ayırarak açıklar ve bunların nasıl ekleneceği, listeleneceği ve değiştirileceği konusunda rehberlik eder. Son olarak, bu uzaklarla veri gönderip alma (push/pull), belirli sürümleri checkout etme ve verileri önbelleğe fetch etme yoluyla nasıl etkileşim kuracağını öğretir.
Bu bölüm, DVC kullanarak ML boru hatlarını otomatikleştirmeye odaklanır. Öğrenenler, ayarlar ve hiperparametreler içeren bir yapılandırma dosyası oluşturur. Ayrıca yönlendirilmiş çevrimsiz grafikler ile boru hattı görselleştirmeyi öğrenir ve bağımlılıkları, komutları ve çıktılarını tanımlamak için komutlar kullanır. DVC boru hatlarının çalıştırılması ele alınır; yerel model eğitimi ve Git’in DVC meta verilerini nasıl izlediği dahil. Ek olarak, DVC’de metrik ve grafik takibi keşfedilir; metriklerin nasıl yazdırılacağı, grafik dosyalarının nasıl oluşturulacağı ve farklı boru hattı aşamalarında metriklerin ve grafiklerin nasıl karşılaştırılacağı gösterilir.
Geçerli egzersiz