top of page

Gino News

sexta-feira, 22 de novembro de 2024

Manipulação de Olhos com Flux.1 Schnell: Guia Prático para Inpainting

Tecnologia Edição de Imagens Tutoriais

No dia 22 de novembro de 2024, um novo guia sobre como manipular olhos em imagens usando o Flux.1 schnell foi revelado, destacando técnicas de inpainting para completar íris ausentes e mudar cores, com o uso de uma máscara em donut.

Create a 2D, linear perspective image using a vector, flat, and corporate style, set on a white, textureless background. The image should depict a close-up of a Caucasian person's eyes, the subject of an article on image manipulation using the Flux.1 schnell app, as it is unveiled on November 22, 2024. The editing process highlights techniques of inpainting to complete missing irises and to change colors, demonstrated through a donut mask. Display the eyes in two stages: the original state, and the edited state with noticeable changes in color and iris position. The background should be blurred to highlight the editing details. Include landmarks or arrows indicating the altered areas in the image, alongside brief text explaining the editing technique to instruct the viewer quickly.

Imagem gerada utilizando Dall-E 3

O artigo apresenta um guia abrangente sobre como modificar olhos em imagens utilizando a ferramenta Flux.1 schnell. O autor inicialmente experimentou mover os olhos, mas encontrou dificuldades com os prompts. Após testar diferentes abordagens, descobriu que o uso de uma donut mask permitia alterar as cores de forma eficaz e começou a compor um guia visual.


O artigo é dividido em várias seções e demonstra um processo passo a passo para realizar a modificação dos olhos. As etapas incluem fazer 'olhos em branco', completar íris ausentes, mover a íris para coordenadas desejadas e usar o MediaPipe para detectar marcos faciais, o que facilita o processo de edição.


Além das etapas práticas, o artigo também discute limitações do método atual, que depende do MediaPipe, um modelo não treinável. O autor sugere que futuras melhorias devem se concentrar em treinar um modelo especializado para melhor desempenho em várias poses da cabeça.


  1. Fazer "olhos em branco" usando classic-inpaint

  2. Completar íris ausentes que estão escondidas pela pálpebra

  3. Mover a íris para as coordenadas desejadas (x, y)

  4. Usar MediaPipe para detectar marcos faciais

  5. Utilizar máscaras para realizar inpainting eficiente

  6. Ajustar a detecção de tamanho e localização da íris


O autor conclui que, embora o Flux.1 schnell ofereça uma maneira inovadora de manipular imagens, a dependência de um modelo limitado como o MediaPipe apresenta desafios. Propõe-se a evolução do projeto para incluir um modelo de detecção que seja mais adaptável a diferentes ângulos e expressões faciais, visando a melhoria na precisão e facilidade de uso.


O guia do autor proporciona insights valiosos sobre técnicas de edição de imagens, especialmente na manipulação de olhos. Essa abordagem inovadora tem o potencial de beneficiar artistas digitais e entusiastas da edição de imagens. Para mais conteúdos atualizados diariamente, inscreva-se em nossa newsletter e continue aprimorando suas habilidades em edição!


FONTES:

    1. Mediapipe Change Eyes Direction

    2. Flux.1 schnell

    3. Flux.1 schnell inpaint

    4. classic-inpaint

    REDATOR

    Gino AI

    22 de novembro de 2024 às 19:23:15

    PUBLICAÇÕES RELACIONADAS

    Create a 2D, linear visual representation using a flat, corporate illustration style. The image showcases an artificial intelligence model symbolized as a human brain made of circuits and connections, demonstrating the concept of reasoning and efficiency. These circuits should be set against a background that is a mix of blue and green symbolizing technology and innovation, on a textureless white base. The image must also incorporate a brightly shining light, suggestive of fresh ideas and innovations in the field. The overall color scheme should consist of cool tones to convey a professional and technological feel.

    Redução de Memória em Modelos de Raciocínio: Inovações e Desafios

    Illustrate a Canadian AI startup, Cohere's new generative model, Command A, showcased for business applications. This future technology, reported on March 13, 2025, requires just two GPUs, offering enhanced multilingual performance and doubling the context capacity to 256,000 tokens. The image must represent Command A's AI model in a corporate environment, with graphics representing its performance and integration across various platforms. Adopt a 2D linear perspective and flat vector style and maintain a white, texture-less background. Additional elements should include a performance graph, showcasing Command A's efficiency and speed, Cohere's logo, visual elements of various languages symbolizing the model's multilingual capability, and an office environment for the model's business application context.

    Cohere Lança Modelo de IA Multilíngue Command A com Impulsionamento para Empresas

    Visual representation of a novel multimodal language model, called Judge-Image, used for evaluation of artificial intelligence systems. The scene 2D and Linear, has a flat and corporate vector style with a white, untextured background. It shows the Judge-Image in action, interpreting an assortment of images and generating corresponding text on a computer screen. Several artificial intelligence icons symbolizing the area of Judge-Image's operations are scattered around the computer, indicating its function and usage. Also, real-time performance metrics are displayed beside the computer, demonstrating the ongoing analysis and evaluation.

    Patronus AI Lança Judge-Image: Avaliando Sistemas de IA com Precisão

    Imagine a flat, 2D, corporate-style image against a white and textureless background. The scene sets in a metaverse where users are interacting through their 3D avatars, signifying a novel way of socializing. They are standing on the bright, colorful, personalized 3D planets that highlight the innovative feature of self-made planets. Behind them are dynamic maps showing real-time interaction. The entire image is vectored and employs bright colors to symbolize innovation and creativity.

    Peer Global Inc levanta $10,5 milhões e lança planetas pessoais no metaverso

    Fique por dentro das últimas novidades em IA

    Obtenha diariamente um resumo com as últimas notícias, avanços e pesquisas relacionadas a inteligência artificial e tecnologia.

    Obrigado pelo envio!

    logo genai

    GenAi Br © 2024

    • LinkedIn
    bottom of page