On binlerce H100 GPU: Google en iyi 2 süper bilgisayarı oluşturuyor

hadicanim

Aktif Üye
Google bulutu, bir dizi yeni veri merkeziyle büyüyor. Google, yeni sistem başına 26 adede kadar exaflops yapay zeka performansından bahsetmez ve saniyede 26 trilyon (26.000.000.000.000.000.000) işleme karşılık gelir. Müşteriler, örneğin büyük dil modellerini eğitmek için gelecekteki A3 bulut sunucuları aracılığıyla bilgi işlem gücünü kiralayabilir.


Blog gönderisinde Google, şirketin tüm dünyada inşa ettiği A3 GPU süper bilgisayarlarından bahsediyor. Her sistem, farklı miktarlarda ölçeklenen aynı donanım bileşenlerini kullanır.

Nvidia’nın H100 GPU’ları ve Sapphire Rapids olarak da bilinen Intel’in dördüncü nesil Xeon Ölçeklenebilir işlemcileri kullanılıyor. Sistemler görünüşe göre Nvidia’nın DGX100’ünü temel alıyor, dolayısıyla bir küme sekiz H100 hızlandırıcı ve iki Xeon SP CPU’dan oluşmalıdır. Nvidia’nın yerleşik NV bağlantıları ve ilişkili NV anahtarları, Google’ın kendi yazılım yığınını kullanarak GPU’lar arasındaki iletişimi yönetir. Intel ile birlikte geliştirilen özel ağ işlemcileri (Altyapı İşlem Birimleri, IPU’lar) Xeon CPU’ları rahatlatır.


Süper bilgisayar başına 26.000 adede kadar GPU


Bir Google sözcüsü, HPC Wire’a on binlerce H100 GPU’nun en büyük A3 veri merkezlerinde konuşlandırılacağını doğruladı: “En büyük müşterilerimiz için, tek bir kümede 26.000 adede kadar GPU ile A3 süper bilgisayarlar oluşturabiliyoruz ve birden çok Derleme üzerinde çalışıyoruz. en büyük bölgelerimizde kümeler.” Ancak, her sistem aynı miktarda GPU almaz.

Bu ölçekte, Google şu anda dünyanın en hızlı süper bilgisayarlarıyla rekabet edebilir. Mevcut Top500 listesinin lideri olan Frontier, binlerce AMD Epyc işlemci ve Radeon Instinct MI250X GPU ile birden fazla FP64 exaflop’u yönetiyor.

Bu veri biçiminde, 26.000 H100 GPU, en iyi ihtimalle yaklaşık 780 petaflop (0,78 exaflop) elde eder – bu kadar büyük bir ağda gerçek performans oldukça düşük olmalıdır. Buna 6500 Intel CPU’nun bilgi işlem gücü (küme başına iki işlemci ile) eklenir. Yukarıdaki 26 exaflop, Tensorfloat 32 (TF32) veya FP16 gibi daha basit AI formatları için geçerlidir.


Mevcut duruma göre, tam donanımlı bir A3 süper bilgisayar, Top500 listesinde rahatlıkla ikinci sırayı alabilirdi. Bununla birlikte, özel bir şirket olarak Google, listede yer almak için muhtemelen ilgili bir Linpack kıyaslama çalışması yapmayacaktır.




(mm)



Haberin Sonu