Yapay zeka, muazzam bir enerji talebine sahiptir. Bu sürekli açlık, yapay zeka patlamasının arkasındaki veri merkezlerinin büyük karbon ayak izinde ve sınır AI modellerinin eğitimi sırasında karbon emisyonlarının zamanla sürekli artışında belirgindir. Bu nedenle büyük teknoloji şirketlerinin nükleer enerjiye yönelmesi ve güvenilir, karbon salınımı olmayan kaynaklarla beslenen bir gelecek hayal etmesi şaşırtıcı değildir. Ancak nükleer enerjili veri merkezleri hala yıllar uzakta olabilirken, araştırma ve sanayi alanındaki bazı kişiler, AI'nın artan enerji taleplerini azaltmak için şu anda harekete geçiyor. Eğitim, bir modelin yaşam döngüsündeki en enerji yoğun aşamalardan biri olarak ele alınıyor ve çabalarını merkeziyetsizleşmeye odaklıyorlar. Merkeziyetsizlik, model eğitimini bağımsız düğümler ağı üzerinden dağıtarak tek bir platform veya sağlayıcıya bağımlı olmaktan kurtarır. Bu, hesaplamanın enerji kaynaklarının bulunduğu yere gitmesini sağlar; bu, bir araştırma laboratuvarında bekleyen bir sunucu veya güneş enerjisiyle çalışan bir evdeki bir bilgisayar olabilir. Altyapı ve kapasiteyi artırmak için elektrik şebekelerine ihtiyaç duyan daha fazla veri merkezi inşa etmek yerine, merkeziyetsizlik mevcut kaynaklardan enerji kullanarak daha fazla gücü karışıma eklemekten kaçınır.
Donanım uyumu
AI modellerini eğitmek, sıkı bir şekilde bağlı GPU kümeleri arasında senkronize olan büyük bir veri merkezi sporudur. Ancak donanım iyileştirmeleri, büyük dil modellerinin hızla artan boyutuna ayak uydurmakta zorlanırken, devasa tek veri merkezleri artık yeterli olmuyor. Teknoloji firmaları, konumları ne olursa olsun, birden fazla veri merkezinin bir araya getirilmiş gücüne yöneliyor. Örneğin, Nvidia, "coğrafi olarak ayrılmış veri merkezleri arasında büyük ölçekli tek iş AI eğitimi ve çıkarımı için gereken performansı sağlayabilen" Spectrum-XGS Ethernet'i piyasaya sürdü. Benzer şekilde, Cisco, "coğrafi olarak dağılmış AI kümelerini bağlamak" için tasarlanmış 8223 yönlendiricisini tanıttı. Diğer şirketler, sunuculardaki kullanılmayan hesaplama gücünü değerlendiriyor ve GPU-as-a-Service iş modelinin ortaya çıkmasına neden oluyor. Akash Network, kendisini "veri merkezleri için Airbnb" olarak tanıtan bir eşler arası bulut bilişim pazarıdır. Ofislerde ve daha küçük veri merkezlerinde kullanılmayan veya az kullanılan GPU'lara sahip olanlar sağlayıcı olarak kaydolurken, hesaplama gücüne ihtiyaç duyanlar, sağlayıcılar arasında seçim yapabilen ve GPU'larını kiralayabilen kiracılar olarak kabul edilir.
Yazılım senkronizasyonu
Donanımı düzenlemenin yanı sıra, merkeziyetsiz AI eğitimi, yazılım tarafında da algoritmik değişiklikler gerektirir. İşte burada, dağıtık makine öğreniminin bir biçimi olan federated learning devreye girer. Bu, güvenilir bir varlık, örneğin merkezi bir sunucu tarafından barındırılan bir küresel AI modelinin ilk versiyonu ile başlar. Sunucu, modeli katılımcı kuruluşlara dağıtır; bu kuruluşlar, kendi verileri üzerinde yerel olarak eğitir ve yalnızca model ağırlıklarını güvenilir varlıkla paylaşır. Güvenilir varlık daha sonra ağırlıkları toplar, genellikle bunları ortalama alarak, küresel modele entegre eder ve güncellenmiş modeli katılımcılara geri gönderir. Bu işbirlikçi eğitim döngüsü, model tamamen eğitilmiş olarak kabul edilene kadar tekrar eder. Ancak hem verilerin hem de hesaplamanın dağıtılmasının dezavantajları vardır. Örneğin, model ağırlıklarının sürekli gidip gelmesi yüksek iletişim maliyetlerine yol açar. Hata toleransı başka bir sorundur.
AI geliştirme platformu
Prime Intellect, beş kıtada yayılan 10 milyar parametreli INTELLECT-1 modelinin önemli bir bileşeni olarak DiLoCo algoritmasının bir varyantını uyguladı. 0G Labs, merkeziyetsiz bir AI işletim sistemi üreticisi, sınırlı bant genişliği ile ayrılmış kümeler ağı altında 107 milyar parametreli bir temel modeli eğitmek için DiLoCo'yu uyarladı. Bu arada, popüler açık kaynaklı derin öğrenme çerçevesi PyTorch, DiLoCo'yu hata toleransı teknikleri deposuna dahil etti.
Daha enerji verimli bir AI eğitimi
Donanım ve yazılım iyileştirmeleri ile merkeziyetsiz AI eğitimi, AI'nın enerji sorununu çözmek için hazır durumda. Bu yaklaşım, modelleri "daha ucuz, daha kaynak verimli, daha enerji verimli bir şekilde" eğitme seçeneği sunuyor. Ve Douillard, "DiLoCo gibi eğitim yöntemlerinin tartışmasız daha karmaşık olduğunu kabul etse de, sistem verimliliği açısından ilginç bir denge sağlıyor" diyor. Örneğin, artık çok hızlı bant genişliği inşa etmeden, uzak konumlardaki veri merkezlerini kullanabilirsiniz. Dou
SiFive, veri merkezi yol haritasını hızlandırmak için 400 milyon dolarlık Seri G yatırımını topladı ve 3.75 milyar dolarlık bir değerlemeye ulaştı. Bu yazı, "SiFive 400M Dolar Turu, Agentic AI Talebi için Yeni CPU Savaş Alanını Vurguluyor" başlığıyla EE Times'ta yayımlandı.
SiFive, bugün yüksek performanslı veri merkezi yol haritasını hızlandırmak amacıyla 400 milyon dolarlık aşırı talep gören bir Seri G finansman turu gerçekleştirdiğini duyurdu. Atreides Management tarafından yönetilen bu tur, Positron, Mythic ve Cerebras gibi diğer son yatırımları da içermektedir; ayrıca daha önce Axiado, Astera Labs ve Enfabrica'ya da yatırım yapmıştır. Bu finansman turu ile SiFive'ın toplam finansmanı yaklaşık 970 milyon dolara ulaştı. [...] Bu yazı, SiFive'ın 400 milyon dolarlık turunun, Agentic AI talebi için yeni CPU savaş alanlarını vurguladığını belirtiyor.
Zamanın ötesinde bir azim, inanç ve isyan hikayesi, Samson: A Tyndalston Story'nin bugün GeForce NOW kütüphanesine katılmasıyla sahne alıyor. Liquid Swords'un büyük bir heyecanla beklenen bu çıkışı, GeForce NOW sayesinde neredeyse her cihazda akışa sunulabiliyor ve sinematik yoğunluk ile efsanevi hikaye anlatımını buluta taşıyor. Bunu dört […] parçasından biri olarak yakalayın.
Eski Google DeepMind araştırmacısı Andrew Dai, büyük laboratuvarlardaki yapay zeka modellerinin, en azından görsel ipuçlarını anlamak söz konusu olduğunda, 3 yaşındaki bir çocuğun zekasına sahip olduğunu düşünüyor.
Birçok tahmine göre, kuantum bilgisayarlarının siber güvenlik, ilaç geliştirme ve diğer endüstrilerdeki potansiyelini gerçekleştirmek için milyonlarca qubit'e ihtiyacı olacak. Sorun şu ki, belirli bir tür qubit'in milyonunu aynı anda kontrol etmek isteyen herkes, milyonlarca lazer ışınını kontrol etme sorunuyla karşılaştı. MIT, Colorado Üniversitesi Boulder Kampüsü, Sandia Ulusal Laboratuvarları ve MITRE Corporation'dan bilim insanlarının, artırılmış gerçeklik, biyomedikal görüntüleme ve diğer alanlardaki birçok zorluğun üstesinden gelmek için geliştirdikleri görüntü projeksiyon teknolojisi tam da bu zorluğu aşmayı hedefliyordu. Bu teknoloji, iki insan yumurta hücresinin boyutundan daha küçük bir alana Mona Lisa'yı projekte edebilen, 0.1 kare milimetreden daha küçük bir fotonik çip şeklinde geliyor. "Başladığımızda, devrim niteliğinde bir görüntüleme teknolojisi üreteceğimizi asla tahmin etmemiştik," diyor, Quantum Moonshot adı verilen elmas bazlı kuantum bilgisayar projesinin liderlerinden biri ve Colorado Üniversitesi Boulder Kampüsü'nde kuantum mühendisliği profesörü olan Matt Eichenfield. Çip, saniyede kare milimetre başına 68.6 milyon bireysel ışık noktası—fiziksel piksellerden ayırt etmek için "tarayıcı pikseller" olarak adlandırılıyor—projekte edebiliyor, bu da önceki teknolojilerin, örneğin mikro-elektromekanik sistemler (MEMS) mikromirror dizilerinin yeteneğinin elliden fazla katı. "Artık difraksiyonun izin verdiği mutlak sınırda bir tarayıcı piksel ürettik," diyor MIT'de misafir araştırmacı ve QuEra Computing'de fotonik mühendisi olan Henry Wen. Çipin ayırt edici özelliği, voltaja yanıt olarak çipin düzleminden dışarı doğru kavislenen küçük metalik kantileverlerin bir dizisidir ve ışık için mini "kayak rampaları" gibi işlev görür. Işık, her kantileverin uzunluğu boyunca bir dalga kılavuzu aracılığıyla yönlendirilir ve ucundan çıkar. Kantileverler, voltaj altında genişleyip daralan piezoelektrik bir malzeme olan ince bir alüminyum nitrit tabakası içerir, bu da mikromakinenin yukarı ve aşağı hareket etmesini sağlar ve dizinin iki boyutlu bir alanda ışık ışınlarını taramasına olanak tanır. Eichenfield, ekibin başarısının büyüklüğüne rağmen, kantileverlerin mühendislik sürecinin "oldukça sorunsuz" olduğunu söylüyor. Her kantilever, dört ince malzeme katmanından oluşur ve dinlenme durumunda düzlemden yaklaşık 90 derece kıvrılmıştır. Bu kadar yüksek bir kavis elde etmek için ekip, soğutulduğunda bireysel katmanların büzülme ve genişleme farklılıklarından yararlandı. Dört malzeme katmanının üzerine, her kantileverin genişliği boyunca kıvrılmasını önleyen dalga kılavuzuna dik olarak uzanan bir dizi silisyum dioksit çubuğu da eklenmiştir. Bir mikro-kantilever, ışığı doğru yere projekte etmek için kıvrılır ve hareket eder. Matt Saha, Y. Henry Wen ve diğerleri. Çipin kendisini mühendislik etmekten daha fazla zorluk, çipin görüntü ve videoları projekte etme detaylarını çözmekti. MITRE'den araştırmacı Andy Greenspon'a göre, kantileverlerin ışık ışınlarını senkronize etme ve zamanlama sürecini çözmek önemli bir çaba gerektirdi. Şimdi, ekip çip aracılığıyla A Charlie Brown Christmas filmini başarıyla projekte etti. Çip, Mona Lisa'nın yaklaşık 125 mikrometre boyutunda bir görüntüsünü projekte etti. Matt Saha, Y. Henry Wen ve diğerleri. Çip, herhangi bir önceki ışın tarayıcıdan daha fazla noktayı belirli bir zaman aralığında projekte edebildiği için, kuantum bilgisayarlarındaki çok daha fazla qubit'i kontrol etmek için de kullanılabilir. Quantum Moonshot programının misyonu, milyonlarca qubit'e ölçeklenebilen bir kuantum bilgisayarı inşa etmektir. Bu nedenle, her birini kontrol etmenin ölçeklenebilir bir yoluna ihtiyaç duyulmaktadır, diyor Wen. Her qubit'in her an kontrol edilmesi gerekmediğini fark eden ekip, çipin ışık ışınlarını iki boyutlu bir alanda hareket ettirme yeteneğinin, çok daha az lazerle tüm qubit'leri kontrol etmelerine olanak tanıyacağını belirtti. Wen'in çipin geliştirebileceğini düşündüğü bir diğer süreç ise 3D baskı için nesneleri taramaktır. Bugün, bu genellikle bir nesnenin tüm yüzeyini taramak için tek bir lazer kullanmayı içerir. Ancak yeni çip, potansiyel olarak binlerce lazer ışını kullanabilir. "Artık saatler süren bir süreci dakikalara indirebileceğinizi düşünüyorum," diyor Wen. Wen, farklı kantilever şekillerinin potansiyelini keşfetmek için de hey
Manchester Üniversitesi'nde matematik profesörü olan David J. Silvester, akışkan davranışındaki ani değişiklikleri tespit etmek için yeni bir makine öğrenimi yöntemi geliştirdi. Bu yöntem, bu tür kararsızlıkları tanımlamanın hızını ve maliyetini artırarak fiziksel sistemleri simüle etmede makine öğreniminin karşılaştığı en büyük engellerden birini aşmayı sağlıyor. Bulgular, Journal of Computational Physics dergisinde yayımlandı.
Intel Corp., veri merkezlerinde teknolojisinin kullanımını teşvik etmeye çalışırken, Alphabet Inc.'in Google'ın gelecekteki Xeon işlemcileri ve diğer çiplerini kullanma taahhüdünde bulunduğunu açıkladı.