top of page

Gino News

quinta-feira, 8 de fevereiro de 2024

Google Gemma 2 2B: Desempenho Promissor em Dispositivos Móveis

Tecnologia Inteligência Artificial Dispositivos Móveis

O modelo Gemma 2 2B da Google está mostrando desempenho eficiente em diversos dispositivos móveis, conforme relatos de testes iniciais de usuários. Os testes destacam a capacidade do modelo em smartphones como o Motorola g84 e o iPhone 15 Pro, com tempos de resposta rápidos e uso otimizado de memória.

Imagem gerada utilizando Dall-E 3

O modelo Gemma 2 2B da Google tem apresentado desempenho robusto em dispositivos móveis, de acordo com feedbacks recentes de usuários. Em um smartphone Motorola g84, as versões quantizadas Q4 e Q8 do modelo conseguem gerar mais de 4 tokens por segundo, utilizando pouca memória no frontend Layla. A versão otimizada para dispositivos ARM, desenvolvida por ThomasBaruzier, melhora ainda mais o desempenho, alcançando entre 5,5 e 6,1 tokens por segundo e carregando em menos de dez segundos.


  1. Desempenho de mais de 4 tokens por segundo nas versões Q4 e Q8.

  2. Versão otimizada para ARM alcança 6,1-5,5 tokens por segundo.

  3. Tempo de carregamento inicial de 15-20 segundos, reduzido para menos de 10 segundos na versão otimizada.


Os testes no Motorola g84 também revelaram que o modelo responde bem a ajustes de temperatura e possui um vocabulário diversificado. Ele pode lidar com contextos de 8-16k em telefones com 6-8GB de RAM, com uma leve desaceleração para contextos maiores. Apesar de algumas inconsistências lógicas e a tendência de dividir histórias em capítulos, essas falhas são menos frequentes em comparação com outros modelos pequenos.


- Responde bem a ajustes de temperatura. - Vocabulário diversificado. - Lida com contextos de 8-16k em dispositivos com 6-8GB de RAM. - Inconsistências lógicas e divisão de histórias em capítulos são menos frequentes.


Em um iPhone 15 Pro, outro usuário executou o modelo Gemma 2B quantizado usando MLX Swift, relatando desempenho comparável ao GPT 3.5 turbo e Mixtral 8x7B nos benchmarks da LMSys.org. O código e a documentação para essa implementação estão disponíveis no GitHub, permitindo que outros interessados repliquem ou aprimorem esse trabalho.


O modelo Gemma 2 2B da Google está se mostrando uma solução promissora para a execução de IA em dispositivos móveis, com desempenho notável e otimizações específicas para diferentes plataformas. À medida que mais usuários testam e fornecem feedback, espera-se que o modelo continue a evoluir, oferecendo ainda mais eficiência e capacidade em futuros desenvolvimentos.


FONTES:
  1. Google's Gemma 2 2B

  2. GitHub

REDATOR

Gino AI

27 de setembro de 2024 às 20:12:25

PUBLICAÇÕES RELACIONADAS

Create a 2D, linear and corporate-style vector image symbolizing a significant milestone in artificial intelligence technology. This image shows the Gemini 2.0 Flash, a model that integrates native image generation and text-based editing. The interface of Gemini 2.0 Flash is shown in use, placed against a plain, white, and texture-less background. In the image, you can see it generating images from text commands within a digital workspace. Additional elements in the image include symbols of artificial intelligence, like brain and circuit icons. Use vibrant colors to convey innovation and technology, and apply a futuristic style that aligns with the vision of advanced technology.

Google Lança Gemini 2.0 Flash: Revolução na Geração de Imagens com IA

Create a vector-style, corporate-like 2D linear image set on a plain white, untextured background. The main focus is a chatbot, symbolizing the new version of Gemini 2.0 Flash Thinking, which is interacting with various Google applications iconized in brilliant, vibrant colors to convey the notion of integration, personalization, and innovation. This interaction suggests the advanced memory and integration capabilities that allow this chatbot to provide more customized, contextual responses to the users.

Google Apresenta Gemini 2.0: Mais Inteligência e Conexão nas Respostas do Chatbot

Create a 2D, linear visual representation using a flat, corporate illustration style. The image showcases an artificial intelligence model symbolized as a human brain made of circuits and connections, demonstrating the concept of reasoning and efficiency. These circuits should be set against a background that is a mix of blue and green symbolizing technology and innovation, on a textureless white base. The image must also incorporate a brightly shining light, suggestive of fresh ideas and innovations in the field. The overall color scheme should consist of cool tones to convey a professional and technological feel.

Redução de Memória em Modelos de Raciocínio: Inovações e Desafios

Visualize an environment from a revolutionary technological future. This setting showcases interactive robots carrying out daily tasks, symbolizing AI integration with human tasks. These robots interact amicably with humans to highlight potential collaboration. They are designed to follow natural language commands, exemplifying an advance that could transform machine usefulness and efficacy. The background of the image is clean, white, and devoid of texture to keep the focus on the robots and their interaction. The image is in 2D and has a linear perspective. Using flat, corporate vector style reflects simplicity and communicates complex ideas with clarity. The prominent colors are blues and greens, conveying a feeling of technology and innovation.

Gemini Robotics: O Futuro dos Robôs com a Linguagem Natural do Google

Fique por dentro das últimas novidades em IA

Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

Obrigado pelo envio!

logo genai

GenAi Br © 2024

  • LinkedIn
bottom of page