top of page

Gino News

domingo, 22 de dezembro de 2024

Together Serverless Lança Multi-LoRA: Personalização de Modelos AI em Escala

Tecnologia Inteligência Artificial Inovação

Hoje, a Together AI anunciou o lançamento do Multi-LoRA no Together Serverless, uma solução inovadora que permite a personalização de modelos de inteligência artificial em larga escala com o uso de LoRA (Low-Rank Adaptation), permitindo o fine-tuning e a implementação de centenas de adaptadores personalizados a um custo reduzido.

Create a 2D, linear vector illustration in a flat and corporate style. The focus of the image is a visual representation of an artificial intelligence model operating on a texture-less white background, symbolizing advanced technology and innovation. Multiple Low-Rank Adaptation (LoRA) adapters are being integrated into the model, highlighting the scalability and customization flexibility of this technology. Design elements include dynamic arrows symbolizing exchanging and the fluidity of the adapters. Use cool colors, such as different shades of blues and greens, radiating trust and technology.

Imagem gerada utilizando Dall-E 3

O novo suporte para LoRA no Together Serverless representa uma abordagem revolucionária para a fine-tuning de modelos de inteligência artificial, permitindo que as empresas adaptem seus modelos de forma eficiente e econômica. Essa tecnologia elimina a complexidade e os custos relacionados à gestão de múltiplos modelos, permitindo a operacionalização de diversos adaptadores personalizados com um único modelo base.


As principais características incluídas no lançamento são a inferência serverless com preços baseados em tokens, suporte para Multi-LoRA que possibilita a troca dinâmica de adaptadores, e uma API de fine-tuning de LoRA para facilitar a criação e teste de adaptadores personalizados. Isso possibilita que empresas como Salesforce e Zomato utilizem modelos ajustados em produção rapidamente, promovendo uma colaboração eficaz com plataformas de fine-tuning.


A abordagem Multi-LoRA facilita o atendimento a diversas demandas do mercado, permitindo que agências de marketing ou equipes corporativas implementem adaptadores específicos para diferentes tarefas, como automação de atendimento ao cliente ou detecção de fraudes. Essa flexibilidade reduz significativamente os custos e acelera o processo de experimentação.


  1. Inferência LoRA serverless com preços por token.

  2. Suporte a Multi-LoRA permitindo a troca dinâmica de adaptadores.

  3. API de fine-tuning para facilitar a personalização de modelos.

  4. Colaboração com empresas líderes para produção de modelos ajustados.

  5. Redução das complexidades e custos na operação de múltiplos modelos.


A introdução do Multi-LoRA na infraestrutura serverless da Together AI otimiza o desempenho ao eliminar a sobrecarga típica do funcionamento dinâmico de adaptadores. Isso garante que o desempenho do modelo base se mantenha robusto, atingindo até 90% da performance, enquanto proporciona uma economia significativa em custos operacionais.


- Economia de custos com modelos personalizados. - Capacidade de experimentar e iterar rapidamente. - Múltiplos casos de uso em setores diversos. - Facilidade de implementação para empresas de diferentes tamanhos.


As implicações da nova funcionalidade Multi-LoRA são vastas, oferecendo um caminho escalável e econômico para empresas que buscam personalizar suas soluções de IA. Com o acesso a uma plataforma que simplifica a implementação de adaptadores e reduz custos, as organizações têm a oportunidade de inovar mais rapidamente e aumentar sua competitividade no mercado de inteligência artificial.


A nova tecnologia Multi-LoRA da Together AI não apenas melhora a eficiência e a economia na personalização de modelos de IA, mas também abre portas para inovações em diversos setores. Para aqueles que desejam aprofundar seus conhecimentos sobre essa tecnologia, vale a pena visitar a documentação ou se inscrever na nossa newsletter para mais conteúdos atualizados diariamente.


FONTES:

    1. Together AI

    2. OpenPipe

    3. Hugging Face

    4. Salesforce

    5. The Washington Post

    REDATOR

    Gino AI

    22 de dezembro de 2024 às 14:31:08

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear perspective image that echoes a corporate and tech-savvy feel. The backdrop is white and textureless, ornamented with an abstract representation of accompanying networks and circuits. Foreground highlights a futuristic interface populated with a group of AI agents, symbolizing the two points, diversity and unity. Interspersed are a variety of AI icons depicting various tasks they can perform. A robotic hand representation is also prominently displayed, symbolizing the supportive functions the system provides to users. Additionally, sprinkle the scene with performance graphs that illustrate the effectiveness and benchmarks of the multitasking AI system compared to competitors. Capture elements of Flat and Vector design styles in the composition.

    Manus: O Novo Sistema de IA que Promete Revolucionar Tarefas Autônomas

    Create a 2D, vector-style artwork set in a clinical setting. On a white, textureless background, illustrate the scene with a flat and corporate aesthetic. A healthcare professional is preparing to administer an injection of lenacapavir to a diverse group of patients. The syringe is a visual symbol of the innovative treatment. The patients, representing a broad range of genders and descents such as Middle-Eastern female, Hispanic male, and South Asian transgender person, convey hope and are the beneficiaries of this advancement. The environment, symbolizing the seriousness of the treatment, is a doctor's office furnished with charts and graphs indicating the reduction in HIV infections due to the new treatment. Use a colour palette consisting of shades of blue and green to transmit trust and hope.

    Lenacapavir: Injeção Anual Promissora para Prevenção do HIV

    Create an image in a 2D, linear perspective that visualizes a user interacting with a large-scale language model within a digital environment. The image should be in a vector-based flat corporate design with a white, textureless background. Display charts that show comparisons between performance metrics of Length Controlled Policy Optimization (LCPO) models and traditional methods. Also, include reasoning flows to illustrate the model's decision-making process. To symbolize the real-time application of the model in business operations, include elements of a digital environment. Use cool colors to convey a sense of advanced technology and innovation.

    Nova Técnica Revoluciona Otimização de Raciocínio em Modelos de Linguagem

    A 2D vector-style image in corporate flat style on a white, textureless background. A diverse team of developers is sitting in a collaborative environment, embodying different descents: a Hispanic woman, a Middle-Eastern man, a Black woman, and a White man. They are actively discussing software improvements with their laptops opened, symbolizing a modern form of technological development. Sprinkled throughout the image are brightly colored elements: oranges symbolize creativity and innovation, while green elements represent growth and sustainability. Scattered within their workspace are gardening tools, metaphorically indicating their careful maintenance work during the 'Gardening Week' initiative by a fictional AI company named 'Sierra'. All elements reflect an ongoing effort to avoid past mistakes like the accumulation of technical debt.

    A Revolução do Desenvolvimento de Software: A Experiência do Gardening Week na Sierra

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page