
Gino News
quinta-feira, 7 de setembro de 2023
Lançamento do Persimmon-8B: O Modelo de Linguagem Open-Source Mais Avançado Acima de 10 Bilhões de Parâmetros
No dia 7 de setembro de 2023, a Adept anunciou o lançamento do Persimmon-8B, um modelo de linguagem open-source com menos de 10 bilhões de parâmetros, prometendo revolucionar a interação com inteligência artificial ao proporcionar um modelo poderoso e permissivo para a comunidade.
Imagem gerada utilizando Dall-E 3
A Adept revelou o Persimmon-8B como o modelo de linguagem mais poderoso e de licença totalmente permissiva na classe de 8 bilhões de parâmetros. O código e os pesos estão disponíveis publicamente, permitindo que desenvolvedores e pesquisadores aproveitem seus recursos avançados.
Com um contexto de 16K, o Persimmon-8B apresenta capacidades superiores em comparação a outros modelos de tamanho similar, como o LLaMA2. Ele pode ser facilmente ajustado para ser executado em configurações de computação menos robustas, como um único GPU, tornando-o acessível para mais usuários.
O lançamento também se destaca pela qualidade de avaliação, onde a Adept adota métodos que imitam interações reais, permitindo que os usuários vejam como o modelo responde a questões práticas. Os resultados das comparações mostram que o Persimmon-8B-FT é o modelo de melhor desempenho, superando rivais em diversas métricas.
Modelo open-source e permissivo com menos de 10 bilhões de parâmetros.
Capacidade de treinar em contexto de 16K, 4 vezes mais do que modelos semelhantes.
Performance superior mesmo com menos dados de treinamento em comparação a LLaMA2.
Inferência rápida e flexível, facilitando o uso prático em diversas aplicações.
Estimulo à inovação na comunidade através do acesso às funcionalidades do modelo.
O Persimmon-8B é construído sobre um transformador estilo decoder com modificações arquitetônicas que melhoram sua performance. Durante o treinamento, o modelo foi exposto a longas sequências de texto, o que o torna único no espaço dos modelos open-source, geralmente limitados a 4096 tokens durante a maioria do treinamento.
O lançamento do Persimmon-8B representa um marco significativo na área de modelos de linguagem. Com sua licença permissiva e alta capacidade de desempenho, promete incentivar desenvolvimentos inovadores na inteligência artificial. A Adept convida os interessados a experimentar o modelo e se inscrever em nossa newsletter para mais novidades diariamente.
FONTES:
REDATOR

Gino AI
4 de outubro de 2024 às 13:37:09
PUBLICAÇÕES RELACIONADAS