BLOG

Escolher a melhor DRAM para IA

Last updated:

  Esta página foi traduzida automaticamente por DeepL. Switch to English

À medida que as cargas de trabalho de IA se tornam mais exigentes, a seleção da configuração correta da DRAM é crucial para melhorar o desempenho. Mas o que é mais importante, velocidade ou capacidade? Neste artigo, cinco kits DRAM diferentes serão avaliados num PC de jogos/IA para encontrar a melhor configuração DRAM.

Serão testadas diferentes configurações de DRAM utilizando a ferramenta Ollama, medindo os tokens por segundo e a utilização de memória em três grandes modelos de linguagem (LLM).

Configuração de teste

A plataforma de ensaio é constituída por:

Modelos de IA

Foram avaliados três LLMs (Large Language Models) de diferentes tamanhos e com diferentes exigências de memória:

  • Llama 3.2 (3B) - Um modelo leve adequado para a maioria dos PCs com IA.
  • Llama 3.1 (8B) - Um modelo de gama média que beneficia tanto da velocidade como da capacidade.
  • DeepSeek-R1 (70B) - Um modelo grande que ultrapassa os limites da DRAM.

Metodologia de avaliação comparativa

O utilitário Ollama foi utilizado para carregar os diferentes modelos. O Ollama fornece uma pontuação de tokens/segundo para medir a velocidade de inferência. A utilização da memória foi monitorizada para identificar o modo como as diferentes configurações de DRAM lidam com cada modelo. Os prompts testados são os seguintes:

  • "Quais são as vantagens da memória DDR5 em relação à DDR4?"
  • "Escrever um conto sobre uma revolução da IA num mundo onde coexistem humanos e máquinas."
  • "Explicar o conceito de redes neuronais e como são treinadas em termos simples."
  • "Explicar o conceito de aprendizagem por reforço e a sua diferença em relação à aprendizagem supervisionada, com exemplos."

Finalmente, o benchmark Final Fantasy XIV Dawntrail foi testado para medir o desempenho de jogo de cada configuração DRAM. O objetivo é descobrir a configuração DRAM que pode lidar com tarefas de IA e jogos ao mesmo tempo sem comprometer o desempenho.

Resultados e análise

dd2dcdb7-3e61-4cdf-8de9-58c9a6e10923

Fig. 1: Este gráfico mostra os tokens/segundo para cada uma das configurações de DRAM testadas em diferentes LLMs utilizando apenas a CPU.

7880e64e-2639-4fec-a5ba-493f2957a2b6

Fig.2: Desempenho das configurações de DRAM testadas quando os LLMs são executados com a RTX 4090. Os resultados estão em tokens/segundo.

b4aa9215-4486-4ce7-9928-2da5e50e33e8

Fig.3: Medida da utilização da memória do sistema durante a execução de cada LLM. CPU vs CPU e GPU. Os resultados são aproximadamente em GBs.

a2844437-6d97-4179-8d2d-4b58dde4b14d

FFXIV Dawntrail benchmark para cada uma das configurações de DRAM testadas.

Algumas observações importantes os resultados.

As configurações de 32 GB e 48 GB não foram capazes de se ajustar ao modelo DeepSeek-R1 (70B) ao usar apenas a CPU. Mesmo com a RTX 4090 usada, 32GB de DRAM está no limite quando o modelo 70b está em uso.

A velocidade mais elevada do kit CUDIMM de 8400 MT/s supera qualquer outra configuração de DRAM em jogos, mas mesmo com uma RTX 4090 a executar um modelo de IA de grande dimensão, não resta muita memória disponível.

Qual é o melhor kit DRAM para IA?

  • Apenas cargas de trabalho de IA: É bastante improvável que alguém execute qualquer LLM sem uma GPU, pelo que seria preferível um kit DRAM mínimo de 64 GB. Idealmente, o kit DRAM de 96 GB é a melhor escolha para estar preparado para o futuro, no caso de ser utilizado um LLM ainda maior.
  • Jogos + IA: O 8400 MT/s é o vencedor óbvio aqui. Embora o kit DRAM de 64 GB não fique muito atrás nos jogos e uma vez que a RTX 4090 fornece essa memória de sistema extra disponível, esta é a escolha preferida.

Conclusão

Para cargas de trabalho pesadas de IA, a capacidade da DRAM desempenha um papel crítico, especialmente com modelos maiores. No entanto, para sistemas híbridos que gerem jogos e IA, a otimização da velocidade e da latência é igualmente importante. Com LLMs continuamente optimizados para diferentes hardwares e os requisitos são reduzidos, seria melhor ter capacidade de memória extra para que um modelo maior pudesse ser executado no sistema para obter resultados mais precisos.

Com base nas considerações descritas acima, o kit DRAM de escolha é o CMH96GX5M2B7000C40.

REGISTO DE PRODUTOS

CONTEÚDO RELACIONADO