top of page

Gino News

quarta-feira, 25 de outubro de 2023

Vannevar Labs Adota Ray Serve para Soluções de Inferência em Tempo Real

Tecnologia Inovação Machine Learning

Vannevar Labs anunciou, em 25 de outubro de 2023, a adoção do Ray Serve como uma solução de inferência em tempo real, permitindo a execução de mais de 20 modelos de aprendizado de máquina, enquanto atende aos rigorosos requisitos de conformidade e segurança exigidos por redes governamentais e isoladas.

Imagem gerada utilizando Dall-E 3

A Vannevar Labs utiliza machine learning para extrair insights dos dados que coleta, enfrentando o desafio de manter a conformidade regulatória ao auto-hospedar todos os seus modelos. A necessidade de uma solução de inferência online que pudesse ser hospedada internamente levou a equipe a decidir pelo uso do Ray, uma tecnologia que oferece uma plataforma extensível e escalável para a infraestrutura de serviços ML.


Os principais critérios para a escolha de uma solução incluíram a capacidade de auto-hospedagem devido a requisitos de segurança interna, a confiabilidade e adoção com uma ampla comunidade de apoio, e a extensibilidade para atender a futuras demandas como treinamento de modelos e inferência offline. Essas necessidades restringiram as opções a soluções de código aberto, levando à avaliação de plataformas como Cortex, BentoML, Nvidia Triton e, finalmente, Ray Serve.


Ray Serve se destacou por permitir a implantação de múltiplos modelos em um único cluster, alocação fracionada de GPU e facilidade no processo de implantação. O uso de comandos automatizados e a configuração simplificada de serviços tornaram a implementação menos onerosa, especialmente para a equipe de DevOps.


  1. Execução de mais de 20 modelos em um cluster de tempo real.

  2. Apoio de uma comunidade ampla e ativa.

  3. Redução de custos com alocação eficiente de recursos.

  4. Processo de implantação simplificado para novos modelos.

  5. Capacidade de escalar operações em futuras aplicações.


A decisão de auto-hospedar um cluster Ray permitiu à Vannevar Labs ter controle total sobre o processo de implantação, aumentando a eficiência e personalização do ambiente de desenvolvimento. A flexibilidade da infraestrutura não só acelerou a implementação de soluções de ML, mas também garantiu um bom desempenho e escalabilidade para as necessidades futuras da empresa.


- Adoção de tecnologia de ponta. - Necessidade de conformidade em ambientes protegidos. - Desenvolvimento de soluções escaláveis de ML.


A Vannevar Labs busca continuamente talentos para avançar em sua missão de desenvolver produtos inovadores utilizando técnicas avançadas de aprendizado de máquina e coleta de dados, especialmente focadas em resolver problemas para o Departamento de Defesa dos EUA.


A escolha do Ray Serve pela Vannevar Labs pode servir de exemplo para outras startups e empresas que enfrentam desafios semelhantes na implementação de soluções de aprendizado de máquina em ambientes restritos. Este testemunho sobre a eficácia e a comunidade de suporte do Ray Serve reforça a importância da colaboração em tecnologia. Para mais atualizações e conteúdos sobre tecnologia e inovação, inscreva-se em nossa newsletter.


FONTES:

    1. Ray Serve

    2. Cortex

    3. BentoML

    4. Nvidia Triton

    5. Vannevar Labs

    REDATOR

    Gino AI

    3 de outubro de 2024 às 23:10:57

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create a 2D, vector-style artwork set in a clinical setting. On a white, textureless background, illustrate the scene with a flat and corporate aesthetic. A healthcare professional is preparing to administer an injection of lenacapavir to a diverse group of patients. The syringe is a visual symbol of the innovative treatment. The patients, representing a broad range of genders and descents such as Middle-Eastern female, Hispanic male, and South Asian transgender person, convey hope and are the beneficiaries of this advancement. The environment, symbolizing the seriousness of the treatment, is a doctor's office furnished with charts and graphs indicating the reduction in HIV infections due to the new treatment. Use a colour palette consisting of shades of blue and green to transmit trust and hope.

    Lenacapavir: Injeção Anual Promissora para Prevenção do HIV

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    Illustrate a 2D, linear perspective image in a corporate, flat and vector style. The image has a textureless, white background. In the foreground, focus on a central figure who symbolizes a leadership role in AI, but not specifically Stephen Peacock. He is explaining the application of AI in game development. Include a visual context of the game development environment and a logo symbolizing an international game development provider, but not specifically the Keywords Studios logo.

    Keywords Studios Lança Soluções de IA para Desenvolvimento de Jogos

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page