AI Eğitim Paradigmasının Evrimi: Merkezi Kontrolden Merkeziyetsizlik İşbirliğine Teknolojik Devrim
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engeli olan aşamadır; bu, modelin yetenek sınırını ve gerçek uygulama etkisini doğrudan belirler. Çıkarım aşamasındaki hafif çağrılara kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir; bu, AI sistemlerinin inşasında gerçek "ağır sanayi"dir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitimi, tek bir kuruluşun yerel yüksek performanslı kümelerde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımını, gradyan senkronizasyonunu ve hata tolerans mekanizmalarının verimliliğini en üst düzeye çıkarır, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur, yüksek verimlilik ve kaynak kontrolü avantajlarına sahiptir, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da bulunmaktadır.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım yöntemdir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve iş birliği ile yürütülmesi yatmaktadır; bu sayede tek makine hesaplama ve depolama darboğazlarının üstesinden gelinmektedir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilmekte, planlanmakta ve senkronize edilmektedir. Genellikle yüksek hızlı yerel ağ ortamlarında çalışmakta ve NVLink yüksek hızlı bağlantı teknolojisi kullanılarak ana düğüm, alt görevleri koordine etmektedir. Ana akım yöntemler şunları içermektedir:
Veri paralelliği: Her düğüm farklı verilerle eğitim yapar, parametreler paylaşılır, model ağırlıkları ile eşleşmelidir.
Model paralelliği: Modelin farklı bölümlerini farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlama
Boru Hattı Paralel: Aşamalı Seri Uygulama, Üretkenliği Artırma
Tensör paralelliği: Matris hesaplamalarını ince bir şekilde bölme, paralel ayrıntı düzeyini artırma
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; bu, aynı patronun uzaktan birden fazla "ofis" çalışanının işbirliği yaparak görevleri tamamlamasını yönlendirmesiyle benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir geleceği temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinatör olmadan eğitim görevlerini işbirliği içinde tamamlar; genellikle görev dağıtımı ve işbirliği için protokollerle yönlendirilir ve katkıların dürüstlüğünü sağlamak için kripto teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Cihaz heterojenliği ve bölme zorluğu: Heterojen cihazların koordine edilmesi zor, görev bölme verimliliği düşük
İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin.
Birlikte Koordinasyon Eksikliği: Merkezi bir kontrolcü yok, görev dağıtımı ve hata geri alma mekanizması karmaşık
Merkeziyetsizlik eğitimi şu şekilde anlaşılabilir: Dünya genelinden bir grup gönüllü, her biri hesap gücünü katkıda bulunarak modeli birlikte eğitiyor, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olup, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulaması gibi birçok alanı kapsamaktadır; ancak "iş birliği etkili + dürüstlüğü teşvik etme + sonuç doğru" olup olmayacağı hala erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtılmış ve merkeziyetsiz arasındaki geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna odaklanan senaryolar için uygundur. Federated öğrenme, dağıtılmış eğitim mühendislik yapısını ve yerel iş birliği yeteneklerini barındırırken, aynı zamanda merkeziyetsiz eğitimdeki veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında 'kontrollü merkeziyetsizlik' çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizması açısından nispeten ılımlıdır ve endüstride geçici dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsizlik eğitimi tüm görev türlerine uygun değildir. Belirli senaryolarında, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvene dayanmayan düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimleri genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, açık ağda etkili bir şekilde parçalanması ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, yasal uyum ve etik kısıtlamalardan dolayı açıkça paylaşılamaz; işbirliği teşviklerine dayanmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlamalar, günümüzde merkeziyetsizlik eğitiminde mevcut gerçek sınırlamaları oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitiminin sahte bir kavram olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolayca paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında, ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri, veri kalabalıklaştırma eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler, genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özellikler taşımakta olup, P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yollarla işbirlikçi eğitim için çok uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenme öncülüğünde, temsil niteliğinde blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai, sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermektedir, bu da mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise görece daha net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makalede bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarisi sırasıyla analiz edilecek ve Merkeziyetsizlik AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da derinlemesine tartışılacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirme öğrenimi işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmaya kendini adamıştır; böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç büyük modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmalarıyla donatılmış bir AI Merkeziyetsizlik eğitim sistemi inşa etmeyi hedeflemektedir.
Prime Intellect protokol yığını yapısı ve ana modül değerleri:
PRIME-RL: Ayrık Asenkron Pekiştirmeli Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect'in merkeziyetsiz eğitim senaryoları için özel olarak tasarladığı görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve eşzamansız katılımcılar için özel olarak tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her bir eğitim düğümü yerel olarak bağımsız bir şekilde görev döngüsünü tamamlayabilir ve standart arayüz aracılığıyla doğrulama ve birleştirme mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir planlamanın olmadığı ortamlarda esnek eğitim gerçekleştirmek için daha uygundur, bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi desteklemek için bir temel oluşturur.
TOPLOC:Ağırlıksız eğitim davranış doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen bir eğitim doğrulama çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayalı olarak etkin bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tam modelin yeniden hesaplanmasına dayanmamakta, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlamaktadır. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir. Güvensiz eğitim ödül dağıtımını gerçekleştirmek için kritik bir yenilik olup, denetlenebilir ve motive edici Merkeziyetsizlik işbirlikçi eğitim ağlarının inşası için uygulanabilir bir yol sunmaktadır.
SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve birleştirme protokolüdür ve özellikle asenkron, bant genişliği kısıtlı ve düğüm durumunun sürekli değiştiği gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejisini birleştirir, böylece birden fazla düğüm senkronize olmayan durumlarda sürekli kısmi güncellemeler gönderebilir, ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransını önemli ölçüde artırır ve istikrarlı ağırlık konsensüsü oluşturmanın ve sürekli eğitim döngülerinin temelini oluşturur.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi, veri paralelliğine dayanmaktadır ve Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model işbirliği eğitimini tamamlamaktadır. Asenkron güncellemeleri ve kesinti toleransı mekanizmasını birleştirerek, OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamaktadır, bu da küresel işbirliği eğitimine katılımı önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağlarının temel iletişim altyapılarından biri olmaktadır.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsiz AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir. Geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topoloji, gradyan sıkıştırma, düşük hassasiyetli senkronizasyon ve kesintiden kurtarma destekler; tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalıştırılabilir. OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağlarının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır, gerçekten açık, güven gerektirmeyen işbirlikçi eğitim ağlarını oluşturmak için "son bir mil" iletişim altyapısını sağlamaktadır.
Prime Intellect teşvik ağı ve rol dağılımı:
Prime Intellect, herkesin görevlere katılmasına ve gerçek katkılara dayanarak ödüller kazanmasına olanak tanıyan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı oluşturdu. Protokol, üç ana rol temelinde çalışmaktadır:
Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
Eğitim Düğümleri: Yerel eğitimi yürütmek, ağırlık güncellemelerini ve gözlem izlerini göndermek
Doğrulama Düğümleri: TOPLOC mekanizmasını kullanarak eğitim davranışının gerçekliğini doğrular ve ödül hesaplaması ile strateji birleştirmeye katılır.
Protokolün ana süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımını içerir ve "gerçek eğitim davranışları" etrafında bir teşvik kapalı döngüsü oluşturur.
INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayınlanması
Prime Intellect, 2025 yılının Mayıs ayında INTELLECT-2'yi piyasaya sürdü. Bu, asenkron, güvene dayanmayan Merkeziyetsizlik düğümleriyle işbirliği içinde eğitilen dünyanın ilk büyük ölçekli pekiştirme öğrenme modelidir ve 32B parametre boyutuna ulaşmaktadır. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğümle işbirliği içinde eğitilmiştir ve tamamen asenkron bir mimari kullanarak 400 saatten fazla bir eğitim süresine sahiptir. Bu, asenkron işbirliği ağının uygulanabilirliğini ve istikrarını göstermektedir. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in önerdiği "eğitim, uzlaşıdır" paradigmasının ilk sistematik uygulanmasıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, merkeziyetsiz eğitim ağının eğitim sürecinin açık, doğrulayıcı ve ekonomik teşvik kapalı döngüsünü ilk kez gerçekleştirdiğini göstermektedir.
Performans açısından, INTELLECT-2 QwQ-32B üzerinde eğitildi ve kod ve matematik üzerinde özel bir RL eğitimi yapıldı, mevcut açık kaynaklı RL ince ayar modellerinin öncüsü konumundadır. Henüz GPT-4 veya Gemini gibi kapalı kaynaklı modelleri geçmemiş olsa da, gerçek anlamı
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
11 Likes
Reward
11
4
Share
Comment
0/400
RektButStillHere
· 19h ago
Ay ay, çok fena! Merkeziyetten Merkeziyetsizliğe dönüşüm, teknoloji sadece dış görünüşü almak oldu.
View OriginalReply0
ZKProofEnthusiast
· 08-06 04:17
web3 felsefesi gibi AI Merkeziyetsizlik oldu.
View OriginalReply0
P2ENotWorking
· 08-06 04:10
Böyle yaparsanız küçük şirketlerin şansı kalmaz, çok yazık.
AI eğitiminde yeni paradigma: Merkezi kontrolün Merkeziyetsizlik iş birliğine teknik evrimi
AI Eğitim Paradigmasının Evrimi: Merkezi Kontrolden Merkeziyetsizlik İşbirliğine Teknolojik Devrim
AI'nin tüm değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engeli olan aşamadır; bu, modelin yetenek sınırını ve gerçek uygulama etkisini doğrudan belirler. Çıkarım aşamasındaki hafif çağrılara kıyasla, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir; bu, AI sistemlerinin inşasında gerçek "ağır sanayi"dir. Mimari paradigmalar açısından, eğitim yöntemleri dört kategoriye ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.
Merkeziyetsizlik eğitimi, tek bir kuruluşun yerel yüksek performanslı kümelerde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği mimarisi, bellek paylaşımını, gradyan senkronizasyonunu ve hata tolerans mekanizmalarının verimliliğini en üst düzeye çıkarır, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur, yüksek verimlilik ve kaynak kontrolü avantajlarına sahiptir, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da bulunmaktadır.
Dağıtık eğitim, günümüz büyük model eğitiminde ana akım yöntemdir. Temelinde, model eğitim görevlerinin parçalanarak birden fazla makineye dağıtılması ve iş birliği ile yürütülmesi yatmaktadır; bu sayede tek makine hesaplama ve depolama darboğazlarının üstesinden gelinmektedir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kurum tarafından kontrol edilmekte, planlanmakta ve senkronize edilmektedir. Genellikle yüksek hızlı yerel ağ ortamlarında çalışmakta ve NVLink yüksek hızlı bağlantı teknolojisi kullanılarak ana düğüm, alt görevleri koordine etmektedir. Ana akım yöntemler şunları içermektedir:
Dağıtık eğitim, "merkezi kontrol + dağıtık yürütme" kombinasyonudur; bu, aynı patronun uzaktan birden fazla "ofis" çalışanının işbirliği yaparak görevleri tamamlamasını yönlendirmesiyle benzerlik gösterir. Şu anda neredeyse tüm ana akım büyük modeller bu yöntemle eğitim tamamlamaktadır.
Merkeziyetsizlik eğitimi, daha açık ve sansüre dayanıklı bir geleceği temsil eder. Temel özellikleri şunlardır: Birbirine güvenmeyen birden fazla düğüm, merkezi bir koordinatör olmadan eğitim görevlerini işbirliği içinde tamamlar; genellikle görev dağıtımı ve işbirliği için protokollerle yönlendirilir ve katkıların dürüstlüğünü sağlamak için kripto teşvik mekanizmaları kullanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:
Merkeziyetsizlik eğitimi şu şekilde anlaşılabilir: Dünya genelinden bir grup gönüllü, her biri hesap gücünü katkıda bulunarak modeli birlikte eğitiyor, ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsizlik eğitimi" hala sistematik bir mühendislik zorluğu olup, sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulaması gibi birçok alanı kapsamaktadır; ancak "iş birliği etkili + dürüstlüğü teşvik etme + sonuç doğru" olup olmayacağı hala erken prototip keşif aşamasındadır.
Federated öğrenme, dağıtılmış ve merkeziyetsiz arasındaki geçiş biçimi olarak, verilerin yerel olarak saklanmasını ve model parametrelerinin merkezi olarak toplanmasını vurgular, gizlilik uyumuna odaklanan senaryolar için uygundur. Federated öğrenme, dağıtılmış eğitim mühendislik yapısını ve yerel iş birliği yeteneklerini barındırırken, aynı zamanda merkeziyetsiz eğitimdeki veri dağıtım avantajlarını da taşır, ancak yine de güvenilir bir koordinatöre bağımlıdır ve tamamen açık ve sansüre dayanıklı özelliklere sahip değildir. Gizlilik uyum senaryolarında 'kontrollü merkeziyetsizlik' çözümü olarak düşünülebilir; eğitim görevleri, güven yapısı ve iletişim mekanizması açısından nispeten ılımlıdır ve endüstride geçici dağıtım mimarisi olarak daha uygundur.
Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları
Eğitim paradigması açısından, merkeziyetsizlik eğitimi tüm görev türlerine uygun değildir. Belirli senaryolarında, görev yapısının karmaşık olması, kaynak gereksinimlerinin son derece yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvene dayanmayan düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimleri genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, açık ağda etkili bir şekilde parçalanması ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları güçlü olan görevler, yasal uyum ve etik kısıtlamalardan dolayı açıkça paylaşılamaz; işbirliği teşviklerine dayanmayan görevler ise dış katılım motivasyonundan yoksundur. Bu sınırlamalar, günümüzde merkeziyetsizlik eğitiminde mevcut gerçek sınırlamaları oluşturmaktadır.
Ancak bu, merkeziyetsizlik eğitiminin sahte bir kavram olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolayca paralel hale getirilebilen ve teşvik edici görev türlerinde, merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında, ancak bunlarla sınırlı olmamak üzere: LoRA ince ayarı, davranış hizalama sonrası eğitim görevleri, veri kalabalıklaştırma eğitimi ve etiketleme görevleri, kaynak kontrolüne sahip küçük temel model eğitimi ve kenar cihazların katıldığı işbirlikçi eğitim senaryoları yer almaktadır. Bu görevler, genellikle yüksek paralellik, düşük bağlılık ve heterojen hesaplama gücüne tolerans gibi özellikler taşımakta olup, P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yollarla işbirlikçi eğitim için çok uygundur.
Merkeziyetsizlik eğitim klasik proje analizi
Şu anda Merkeziyetsizlik eğitim ve federatif öğrenme öncülüğünde, temsil niteliğinde blok zinciri projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik gerçekleştirme zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai, sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermektedir, bu da mevcut teorik araştırmaların öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun gerçekleştirme yolları ise görece daha net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makalede bu beş projenin arkasındaki temel teknolojiler ve mühendislik mimarisi sırasıyla analiz edilecek ve Merkeziyetsizlik AI eğitim sistemindeki farklılıkları ve tamamlayıcı ilişkileri daha da derinlemesine tartışılacaktır.
Prime Intellect: Eğitim izleri doğrulanabilir güçlendirme öğrenimi işbirlikçi ağ öncüsü
Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı kurmaya kendini adamıştır; böylece herkes eğitim sürecine katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç büyük modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmalarıyla donatılmış bir AI Merkeziyetsizlik eğitim sistemi inşa etmeyi hedeflemektedir.
Prime Intellect protokol yığını yapısı ve ana modül değerleri:
PRIME-RL: Ayrık Asenkron Pekiştirmeli Öğrenme Görev Mimarisi
PRIME-RL, Prime Intellect'in merkeziyetsiz eğitim senaryoları için özel olarak tasarladığı görev modelleme ve yürütme çerçevesidir, heterojen ağlar ve eşzamansız katılımcılar için özel olarak tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanır, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her bir eğitim düğümü yerel olarak bağımsız bir şekilde görev döngüsünü tamamlayabilir ve standart arayüz aracılığıyla doğrulama ve birleştirme mekanizmaları ile işbirliği yapabilir. Geleneksel denetimli öğrenme süreçlerine kıyasla, PRIME-RL, merkezi bir planlamanın olmadığı ortamlarda esnek eğitim gerçekleştirmek için daha uygundur, bu hem sistem karmaşıklığını azaltır hem de çoklu görev paralelliği ve strateji evrimi desteklemek için bir temel oluşturur.
TOPLOC:Ağırlıksız eğitim davranış doğrulama mekanizması
TOPLOC, Prime Intellect tarafından önerilen bir eğitim doğrulama çekirdek mekanizmasıdır ve bir düğümün gerçekten gözlem verilerine dayalı olarak etkin bir strateji öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC, tam modelin yeniden hesaplanmasına dayanmamakta, bunun yerine "gözlem dizisi↔strateji güncelleme" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlamaktadır. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir. Güvensiz eğitim ödül dağıtımını gerçekleştirmek için kritik bir yenilik olup, denetlenebilir ve motive edici Merkeziyetsizlik işbirlikçi eğitim ağlarının inşası için uygulanabilir bir yol sunmaktadır.
SHARDCAST: Asenkron Ağırlık Birleştirme ve Yayılma Protokolü
SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve birleştirme protokolüdür ve özellikle asenkron, bant genişliği kısıtlı ve düğüm durumunun sürekli değiştiği gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ve yerel senkronizasyon stratejisini birleştirir, böylece birden fazla düğüm senkronize olmayan durumlarda sürekli kısmi güncellemeler gönderebilir, ağırlıkların kademeli yakınsamasını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransını önemli ölçüde artırır ve istikrarlı ağırlık konsensüsü oluşturmanın ve sürekli eğitim döngülerinin temelini oluşturur.
OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi
OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız olarak gerçekleştirdiği ve açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitiminde yaygın olarak karşılaşılan bant genişliği kısıtlamaları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimarisi, veri paralelliğine dayanmaktadır ve Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak, küresel senkronizasyonun yüksek iletişim maliyetinden kaçınmakta ve yalnızca yerel komşu düğümlere dayanarak model işbirliği eğitimini tamamlamaktadır. Asenkron güncellemeleri ve kesinti toleransı mekanizmasını birleştirerek, OpenDiLoCo, tüketici düzeyindeki GPU'ların ve kenar cihazlarının eğitim görevlerine istikrarlı bir şekilde katılmasını sağlamaktadır, bu da küresel işbirliği eğitimine katılımı önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağlarının temel iletişim altyapılarından biri olmaktadır.
PCCL: İşbirliği İletişim Kütüphanesi
PCCL, Prime Intellect tarafından merkeziyetsiz AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir. Geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum sorunlarını çözmeyi amaçlamaktadır. PCCL, seyrek topoloji, gradyan sıkıştırma, düşük hassasiyetli senkronizasyon ve kesintiden kurtarma destekler; tüketici sınıfı GPU'larda ve istikrarsız düğümlerde çalıştırılabilir. OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen temel bileşendir. Eğitim ağlarının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırır, gerçekten açık, güven gerektirmeyen işbirlikçi eğitim ağlarını oluşturmak için "son bir mil" iletişim altyapısını sağlamaktadır.
Prime Intellect teşvik ağı ve rol dağılımı:
Prime Intellect, herkesin görevlere katılmasına ve gerçek katkılara dayanarak ödüller kazanmasına olanak tanıyan, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmalarına sahip bir eğitim ağı oluşturdu. Protokol, üç ana rol temelinde çalışmaktadır:
Protokolün ana süreci, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ve ödül dağıtımını içerir ve "gerçek eğitim davranışları" etrafında bir teşvik kapalı döngüsü oluşturur.
INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayınlanması
Prime Intellect, 2025 yılının Mayıs ayında INTELLECT-2'yi piyasaya sürdü. Bu, asenkron, güvene dayanmayan Merkeziyetsizlik düğümleriyle işbirliği içinde eğitilen dünyanın ilk büyük ölçekli pekiştirme öğrenme modelidir ve 32B parametre boyutuna ulaşmaktadır. INTELLECT-2 modeli, üç kıtada yer alan 100'den fazla GPU heterojen düğümle işbirliği içinde eğitilmiştir ve tamamen asenkron bir mimari kullanarak 400 saatten fazla bir eğitim süresine sahiptir. Bu, asenkron işbirliği ağının uygulanabilirliğini ve istikrarını göstermektedir. Bu model, yalnızca performans açısından bir atılım değil, aynı zamanda Prime Intellect'in önerdiği "eğitim, uzlaşıdır" paradigmasının ilk sistematik uygulanmasıdır. INTELLECT-2, PRIME-RL, TOPLOC ve SHARDCAST gibi temel protokol modüllerini entegre ederek, merkeziyetsiz eğitim ağının eğitim sürecinin açık, doğrulayıcı ve ekonomik teşvik kapalı döngüsünü ilk kez gerçekleştirdiğini göstermektedir.
Performans açısından, INTELLECT-2 QwQ-32B üzerinde eğitildi ve kod ve matematik üzerinde özel bir RL eğitimi yapıldı, mevcut açık kaynaklı RL ince ayar modellerinin öncüsü konumundadır. Henüz GPT-4 veya Gemini gibi kapalı kaynaklı modelleri geçmemiş olsa da, gerçek anlamı