
Gino News
quinta-feira, 5 de setembro de 2024
Desempenho Avançado de Clusters de GPU NVIDIA com a Coleção de Kernels Together
A Together AI anunciou a incorporação da GPU NVIDIA H200 em seus clusters, acompanhada pela Together Kernel Collection (TKC), que promete acelerar operações comuns de inteligência artificial, oferecendo ganhos de desempenho significativos em comparação com implementações tradicionais.

Imagem gerada utilizando Dall-E 3
A Together AI, líder em pesquisa de sistemas de inteligência artificial, revelou que seus clusters de GPU agora incluirão a NVIDIA H200, equipada com a Together Kernel Collection (TKC). Essa coleção otimizada promete até 24% de aceleração em operações comuns de treinamento e até 75% em operações fundamentais de inferência em comparação com implementações do PyTorch. Com essas melhorias, os usuários podem reduzir as horas de GPU, aumentando a eficiência de custos e acelerando o tempo de lançamento no mercado.
Os clusters de GPU Together, projetados para todo o ciclo de vida da IA generativa, destacam-se por oferecer um TCO até quatro vezes menor que provedores de nuvem. A confiabilidade de 99,9% dos clusters é garantida através de testes rigorosos, tornando-os ideais para o treinamento de modelos de IA de larga escala e tarefas de HPC. A integração nativa com o PyTorch permite que desenvolvedores de IA utilizem as otimizações do TKC de forma simples e intuitiva.
Os principais recursos da NVIDIA H200 incluem um desempenho de inferência 40% mais rápido em modelos de linguagem e uma capacidade de memória quase dobrada em relação ao modelo anterior, permitindo um processamento eficiente de grandes volumes de dados. A combinação de tecnologias como NVLink e Infiniband facilita a comunicação ultra-rápida entre GPUs, crucial para a escalabilidade do treinamento de IA.
Redução de até 75% nos custos em comparação com provedores de nuvem.
Integração fácil com PyTorch.
Desempenho líder de mercado com 99,9% de confiabilidade.
Otimizações específicas para treinamento e inferência em IA.
Flexibilidade em opções de compromisso e implantação.
Essas melhorias significativas na infraestrutura de IA da Together AI não apenas otimizam o desempenho, mas também oferecem uma excelente proposta de custo-benefício, destacando-se em um mercado competitivo. Assim, as opções flexíveis de implantação, que incluem Slurm, Kubernetes e Bare Metal, garantem que as necessidades variadas dos projetos de IA sejam atendidas.
A introdução da GPU H200 e da TKC representa um avanço significativo para a Together AI e seus clientes, promovendo um ambiente de desenvolvimento mais eficiente e econômico para a inteligência artificial. Para aqueles que buscam impulsionar suas iniciativas de IA, a empresa oferece acesso antecipado aos novos clusters de GPU. Inscreva-se na nossa newsletter para mais atualizações sobre tecnologias emergentes e tendências do setor.
FONTES:
REDATOR

Gino AI
3 de outubro de 2024 às 21:55:27