Yapay zeka iş yükleri daha zorlu hale geldikçe, doğru DRAM yapılandırmasını seçmek performansı artırmak için çok önemlidir. Ama hangisi daha önemli, hız mı kapasite mi? Bu makalede, en iyi DRAM yapılandırmasını bulmak için bir oyun/AI bilgisayarında beş farklı DRAM kiti değerlendirilecektir.
Farklı DRAM kurulumları Ollama aracı kullanılarak test edilecek ve üç büyük dil modelinde (LLM) saniye başına belirteçler ve bellek kullanımı ölçülecektir.
Test platformu şunlardan oluşur:
Farklı bellek taleplerine sahip çeşitli boyutlardaki üç LLM (Büyük Dil Modeli) değerlendirilmiştir:
Farklı modelleri yüklemek için Ollama yardımcı programı kullanılmıştır. Ollama, çıkarım hızını ölçmek için bir belirteç/saniye puanı sağlar. Farklı DRAM konfigürasyonlarının her bir modeli nasıl işlediğini belirlemek için bellek kullanımı izlenmiştir. Test edilen istemler aşağıdaki gibidir:
Son olarak, her bir DRAM yapılandırmasının oyun performansını ölçmek için Final Fantasy XIV Dawntrail kıyaslaması test edilmiştir. Amaç, performanstan ödün vermeden yapay zeka görevlerini ve oyun oynamayı aynı anda gerçekleştirebilecek DRAM yapılandırmasını bulmaktır.
Şekil 1: Bu grafik, sadece CPU kullanan farklı LLM'lerde test edilen DRAM konfigürasyonlarının her biri için jeton/saniye değerlerini göstermektedir.
Şekil 2: LLM'ler RTX 4090 ile çalıştırıldığında test edilen DRAM konfigürasyonlarının performansı. Sonuçlar jeton/saniye cinsindendir.
Şekil 3: Her bir LLM çalıştırılırken sistem bellek kullanımı ölçülmüştür. CPU vs CPU ve GPU. Sonuçlar yaklaşık GB cinsindendir.
Test edilen DRAM yapılandırmalarının her biri için FFXIV Dawntrail kıyaslaması.
Sonuçlarla ilgili birkaç önemli gözlem.
32GB ve 48GB konfigürasyonlar, yalnızca CPU kullanıldığında DeepSeek-R1 (70B) modeline sığmadı. RTX 4090 kullanıldığında bile, 70b modeli kullanıldığında 32GB DRAM sınırda kalıyor.
Yüksek hızlı 8400 MT/s CUDIMM kiti, oyunlarda diğer tüm DRAM yapılandırmalarından daha iyi performans gösteriyor ancak büyük boyutlu bir AI modeli çalıştıran bir RTX 4090 ile bile geriye çok fazla kullanılabilir bellek kalmıyor.
Yapay zeka ağırlıklı iş yükleri için DRAM kapasitesi, özellikle daha büyük modellerde kritik bir rol oynar. Ancak hem oyun hem de yapay zekayı yöneten hibrit sistemler için hız ve gecikme optimizasyonu da bir o kadar önemlidir. LLM'ler farklı donanımlar için sürekli olarak optimize edildiğinde ve gereksinimler azaldığında, daha doğru sonuçlar elde etmek için daha büyük bir modelin sistemde çalışabilmesi için ekstra bellek kapasitesine sahip olmak en iyisi olacaktır.
Yukarıda özetlenen hususlara dayanarak, tercih edilen DRAM kiti CMH96GX5M2B7000C40'tır.
MAKALEDEKI ÜRÜNLER