top of page

Gino News

sábado, 25 de janeiro de 2025

Novas Opções de VMs com NVIDIA H100 para Inference em AI/ML

Tecnologia Inteligência Artificial Computação em Nuvem

Em 24 de janeiro de 2025, o Google Cloud anunciou a introdução de novos tipos de máquinas A3 High VMs com GPUs NVIDIA H100 de 80GB, visando oferecer maior flexibilidade e economia para organizações que utilizam inferência em modelos de Inteligência Artificial e Aprendizado de Máquina.

Create a 2D vector-style, corporate image with a flat design aesthetic. The setting of the image should be a modern, technologically advanced environment illustrating the use of Google Cloud's new A3 High VM configurations. Gradations of blue and bright greens should be used to give the image a modern tech feel. Set against a clean, white, textureless background, a series of computers and servers should be depicted. On these computers, it should be visible that they are running AI and Machine Learning applications. Insert a tech company's logo, representing the company unveiling these advanced technologies. Additionally, include performance graphs to highlight and illustrate the efficiency and power of these advanced VMs. The overall tone of the image should be sophisticated and market-forward.

Imagem gerada utilizando Dall-E 3

O uso crescente de GPUs para inferência em modelos de AI/ML leva organizações a buscar soluções que otimizem custos, especialmente em ambientes de demanda variável. Nesse contexto, as novas A3 High VMs, disponíveis com configurações de 1, 2 e 4 GPUs, oferecem uma alternativa para atender essa necessidade.


Essas máquinas estão acessíveis através do Vertex AI, Google Kubernetes Engine (GKE) e Google Compute Engine, permitindo que empresas escalem suas operações conforme a demanda. Além disso, essas novas instâncias também são oferecidas como Spot VMs e com o recurso Dynamic Workload Scheduler (DWS) em modo Flex Start.


A plataforma GKE, já conhecida por sua eficiência em rodar aplicações web, agora se destaca também no treinamento e na execução de cargas de trabalho de AI. A função de GKE Autopilot auxilia na redução de custos operacionais, oferecendo SLAs em nível de carga de trabalho para operações de inferência.


  1. Novos tipos de máquinas disponíveis com 1, 2 e 4 GPUs.

  2. Implementação facilitada através de plataformas como Vertex AI e GKE.

  3. Spot VMs e Dynamic Workload Scheduler como opções de gerenciamento de custo.

  4. Feedback positivo de clientes sobre melhorias em desempenho.

  5. Maior granulação para atender às necessidades variáveis das organizações.


As novas opções de VMs A3 High proporcionam uma solução prática para empresas que buscam otimizar suas operações de AI/ML, permitindo um gerenciamento mais eficaz de recursos e orçamentos.


- Redução de latência nos modelos de AI. - Aumento da eficiência em uso de recursos. - Flexibilidade na oferta de GPU conforme a demanda. - Facilidade na implementação de novas tecnologias.


Esses avanços tecnológicos prometem não apenas melhorar o desempenho das aplicações de AI/ML, mas também incentivar a adoção mais ampla dessas tecnologias em diversas indústrias.


Com a introdução de máquinas A3 High VMs, o Google Cloud demonstra um compromisso com a inovação e a eficiência. Para as empresas que dependem da inferência em modelos de AI e ML, essas opções representam um passo significativo para otimizar custos e desempenho. Para mais novidades, inscreva-se em nossa newsletter e fique atualizado sobre as últimas tendências e soluções em tecnologia.


FONTES:

    1. Google Cloud

    2. Vertex AI

    3. Google Kubernetes Engine

    4. Dynamic Workload Scheduler

    5. Spot VMs

    REDATOR

    Gino AI

    25 de janeiro de 2025 às 15:31:55

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, vector-style artwork set in a clinical setting. On a white, textureless background, illustrate the scene with a flat and corporate aesthetic. A healthcare professional is preparing to administer an injection of lenacapavir to a diverse group of patients. The syringe is a visual symbol of the innovative treatment. The patients, representing a broad range of genders and descents such as Middle-Eastern female, Hispanic male, and South Asian transgender person, convey hope and are the beneficiaries of this advancement. The environment, symbolizing the seriousness of the treatment, is a doctor's office furnished with charts and graphs indicating the reduction in HIV infections due to the new treatment. Use a colour palette consisting of shades of blue and green to transmit trust and hope.

    Lenacapavir: Injeção Anual Promissora para Prevenção do HIV

    Illustration in a vectorial, flat, and corporate style showing a diverse team of employees interacting with AI technology in a modern office setting. The team consists of a Caucasian man, a Hispanic woman, a Middle-Eastern man, and a Black woman. They're gathered around computers showcasing innovation and AI while also displaying a whiteboard with graphs symbolizing planning and collaboration. The modern office environment underlines the concept of a collaborative workspace. The whole scene is set against a white, textureless backdrop, following a 2D linear perspective to uphold the flat design of the illustration.

    Anthropic Lança Plataforma Colaborativa para Democratizar o Uso de IA em Empresas

    Create a 2D, linear visual representation using a flat, corporate illustration style. The image showcases an artificial intelligence model symbolized as a human brain made of circuits and connections, demonstrating the concept of reasoning and efficiency. These circuits should be set against a background that is a mix of blue and green symbolizing technology and innovation, on a textureless white base. The image must also incorporate a brightly shining light, suggestive of fresh ideas and innovations in the field. The overall color scheme should consist of cool tones to convey a professional and technological feel.

    Redução de Memória em Modelos de Raciocínio: Inovações e Desafios

    An intelligent robotic arm, represented in a 2D linear, vector style with a corporate tone, is seen performing delicate tasks in an advanced research laboratory. This flat, untextured image is set against a white background. The robot arm, designed to emphasize its dexterity and adaptability, is folding a paper into an origami shape and carefully moving around other objects, vividly illustrating the premise of advanced robotics' work. The environment suggests realism with diverse objects simulating a standard workspace. Soft spotlight illumination is used to highlight the robot and its actions, indicating its significant role.

    Google Avança em Robótica Inteligente com Gemini Robotics

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page