BLOG

Wybór najlepszej pamięci DRAM dla sztucznej inteligencji

Last updated:

  Ta strona została automatycznie przetłumaczona przez DeepL. Switch to English

Ponieważ obciążenia związane ze sztuczną inteligencją stają się coraz bardziej wymagające, wybór odpowiedniej konfiguracji pamięci DRAM ma kluczowe znaczenie dla poprawy wydajności. Ale co liczy się bardziej, szybkość czy pojemność? W tym artykule pięć różnych zestawów pamięci DRAM zostanie ocenionych na komputerze do gier/AI w celu znalezienia najlepszej konfiguracji DRAM.

Różne konfiguracje pamięci DRAM zostaną przetestowane za pomocą narzędzia Ollama, mierząc tokeny na sekundę i zużycie pamięci w trzech dużych modelach językowych (LLM).

Konfiguracja testu

Platforma testowa składa się z:

Modele AI

Oceniono trzy modele LLM (Large Language Models) o różnych rozmiarach i różnym zapotrzebowaniu na pamięć:

  • Llama 3.2 (3B) - lekki model odpowiedni dla większości komputerów AI.
  • Llama 3.1 (8B) - model ze średniej półki, który oferuje zarówno szybkość, jak i pojemność.
  • DeepSeek-R1 (70B) - Duży model, który przesuwa limity DRAM.

Metodologia analizy porównawczej

Do załadowania różnych modeli użyto narzędzia Ollama. Ollama zapewnia wynik tokenów/sekundę do pomiaru szybkości wnioskowania. Zużycie pamięci było śledzone w celu określenia, jak różne konfiguracje DRAM radzą sobie z każdym modelem. Przetestowano następujące podpowiedzi:

  • "Jakie są zalety pamięci DDR5 w porównaniu z DDR4?"
  • "Napisz opowiadanie o rewolucji SI w świecie, w którym ludzie i maszyny współistnieją".
  • "Wyjaśnij w prosty sposób koncepcję sieci neuronowych i sposób ich szkolenia".
  • "Wyjaśnij na przykładach pojęcie uczenia ze wzmocnieniem i czym różni się ono od uczenia nadzorowanego".

Na koniec przetestowano benchmark Final Fantasy XIV Dawntrail, aby zmierzyć wydajność w grach każdej konfiguracji DRAM. Celem jest znalezienie konfiguracji DRAM, która może jednocześnie obsługiwać zadania AI i gry bez obniżania wydajności.

Wyniki i analiza

dd2dcdb7-3e61-4cdf-8de9-58c9a6e10923

Rys. 1: Ten wykres pokazuje tokeny/sekundę dla każdej z konfiguracji DRAM testowanych w różnych LLM wykorzystujących tylko CPU.

7880e64e-2639-4fec-a5ba-493f2957a2b6

Rys. 2: Wydajność testowanych konfiguracji DRAM, gdy LLM działa z RTX 4090. Wyniki podano w tokenach/sekundę.

b4aa9215-4486-4ce7-9928-2da5e50e33e8

Rys. 3: Zmierzono wykorzystanie pamięci systemowej podczas uruchamiania każdego LLM. CPU vs CPU i GPU. Wyniki podano w przybliżeniu w GB.

a2844437-6d97-4179-8d2d-4b58dde4b14d

Test porównawczy FFXIV Dawntrail dla każdej z testowanych konfiguracji pamięci DRAM.

Kilka ważnych obserwacji wyników.

Konfiguracje 32 GB i 48 GB nie były w stanie zmieścić modelu DeepSeek-R1 (70B) przy użyciu samego procesora. Nawet w przypadku korzystania z RTX 4090, 32 GB pamięci DRAM jest na krawędzi, gdy używany jest model 70b.

Wyższa prędkość zestawu 8400 MT/s CUDIMM przewyższa każdą inną konfigurację DRAM w grach, ale nawet w przypadku RTX 4090 z dużym modelem AI nie pozostaje zbyt wiele dostępnej pamięci.

Który zestaw DRAM jest najlepszy dla AI?

  • Obciążenia związane wyłącznie ze sztuczną inteligencją: Jest mało prawdopodobne, że ktoś uruchomi LLM bez GPU, więc preferowany byłby zestaw minimum 64 GB DRAM. Idealnym wyborem jest zestaw 96 GB pamięci DRAM, aby zabezpieczyć się na przyszłość w przypadku użycia jeszcze większego LLM.
  • Gaming + AI: 8400 MT/s jest tutaj oczywistym zwycięzcą. Chociaż zestaw 64 GB DRAM nie jest tak daleko w tyle w grach, a ponieważ RTX 4090 zapewnia dodatkową dostępną pamięć systemową, jest to preferowany wybór.

Wnioski

W przypadku obciążeń związanych ze sztuczną inteligencją, pojemność pamięci DRAM odgrywa kluczową rolę, zwłaszcza w przypadku większych modeli. Jednak w przypadku systemów hybrydowych zarządzających zarówno grami, jak i sztuczną inteligencją, optymalizacja szybkości i opóźnień jest równie ważna. Dzięki ciągłej optymalizacji LLM dla różnych urządzeń i zmniejszeniu wymagań, najlepiej byłoby mieć dodatkową pojemność pamięci, aby większy model mógł działać w systemie w celu uzyskania dokładniejszych wyników.

W oparciu o powyższe rozważania, wybranym zestawem pamięci DRAM jest CMH96GX5M2B7000C40.

REJESTRACJA PRODUKTÓW

POWIĄZANA ZAWARTOŚĆ