Efterhånden som AI-arbejdsbelastninger bliver mere krævende, er det afgørende at vælge den rigtige DRAM-konfiguration for at forbedre ydeevnen. Men hvad betyder mest, hastighed eller kapacitet? I denne artikel vil fem forskellige DRAM-kits blive evalueret på en gaming/AI-pc for at finde den bedste DRAM-konfiguration.
Forskellige DRAM-opsætninger vil blive testet ved hjælp af Ollama-værktøjet, der måler tokens pr. sekund og hukommelsesforbrug på tværs af tre store sprogmodeller (LLM'er).
Testplatformen består af:
Tre LLM'er (Large Language Models) af varierende størrelse med forskellige hukommelseskrav blev evalueret:
Ollama-værktøjet blev brugt til at indlæse de forskellige modeller. Ollama giver en tokens/sekund-score til at måle inferenshastigheden. Hukommelsesforbruget blev sporet for at identificere, hvordan forskellige DRAM-konfigurationer håndterer hver model. De testede prompter er følgende:
Endelig blev Final Fantasy XIV Dawntrail-benchmark testet for at måle spilydelsen for hver DRAM-konfiguration. Målet er at finde frem til den DRAM-konfiguration, der kan håndtere AI-opgaver og gaming på samme tid uden at gå på kompromis med ydeevnen.
Fig. 1: Dette diagram viser tokens/sekund for hver af de DRAM-konfigurationer, der er testet i forskellige LLM'er, der kun bruger CPU'en.
Fig.2: Ydeevne for de testede DRAM-konfigurationer, når LLM'erne kører med RTX 4090. Resultaterne er i tokens/sekund.
Fig.3: Målte systemets hukommelsesforbrug, mens hver LLM kørte. CPU vs. CPU og GPU. Resultaterne er ca. i GB.
FFXIV Dawntrail-benchmark for hver af de testede DRAM-konfigurationer.
Et par vigtige observationer af resultaterne.
32GB- og 48GB-konfigurationer kunne ikke passe til DeepSeek-R1 (70B)-modellen, når man kun bruger CPU'en. Selv med RTX 4090 er 32 GB DRAM på grænsen, når 70b-modellen er i brug.
Den højere hastighed på 8400 MT/s CUDIMM-sættet overgår enhver anden DRAM-konfiguration i spil, men selv med en RTX 4090, der kører en stor AI-model, er der ikke meget ledig hukommelse tilbage.
Til AI-tunge arbejdsbelastninger spiller DRAM-kapacitet en afgørende rolle, især med større modeller. Men for hybridsystemer, der håndterer både gaming og AI, er optimering af hastighed og latenstid lige så vigtig. Når LLM'er løbende optimeres til forskellig hardware, og kravene reduceres, ville det være bedst at have ekstra hukommelseskapacitet, så en større model kunne køre i systemet for at opnå mere nøjagtige resultater.
Baseret på ovenstående overvejelser er det valgte DRAM-kit CMH96GX5M2B7000C40.
PRODUKT REGISTRERING