SDXL 1.0 está aqui com recursos aprimorados

A versão mais poderosa do principal algoritmo de texto para imagem do Stability AI, SDXL 1.0, foi apresentada. Ele consome menos recursos de processamento, produz imagens com resolução maior que a versão 0.9 e faz menos consultas de texto. É mais útil e eficiente do que nunca com Stable Diffusion XL 1.0!

As ferramentas de inteligência artificial, como o ChatGPT, não produzem apenas texto. Eles agora podem produzir uma variedade de mídia, incluindo música, filmes e imagens. Qualquer pessoa pode fazer praticamente qualquer imagem com o programa AI Stable Diffusion. A utilização de SD e ferramentas comparáveis, que já são amplamente utilizadas, será consideravelmente melhorada por atualizações.

“Com o SDXL 1.0, o ajuste fino do modelo para dados personalizados é mais fácil do que nunca. LoRAs ou pontos de verificação personalizados podem ser gerados com menos necessidade de disputa de dados. A equipe Stability AI está construindo a próxima geração de estrutura, estilo e controles de composição específicos para tarefas, com T2I/ControlNet especializado para SDXL. Esses recursos estão atualmente em pré-visualização beta, mas fique atento para atualizações sobre o ajuste fino”, anunciou a Stability AI.

Recursos do SDXL 1.0

Os clientes agora podem se especializar em gerar pessoas ou coisas específicas com apenas cinco imagens, graças a um novo recurso beta de ajuste fino. Este utilitário usa um pequeno número de fotos para polir o SDXL 1.0.

Um dos modelos de imagem de acesso aberto mais eficazes atualmente no mercado, o SDXL 1.0 possui um pipeline de conjunto de modelos de 6,6 bilhões de parâmetros e um modelo básico de 3,5 bilhões de parâmetros. Você pode experimentar o modelo gratuitamente usando o Clipdrop de Stability.ai.

Melhore suas imagens com o novo Stability AI SDXL 0.9

O modelo completo para difusão latente é um pipeline de diferentes especialistas: na primeira fase, o modelo básico gera pacientes (ruidosos), que são posteriormente processados por um modelo de refinamento feito especialmente para as etapas finais de remoção de ruído. Não se esqueça que o modelo base pode ser usado de forma independente como um módulo.

Essa arquitetura de dois estágios permite a resiliência da geração de imagens sem perder velocidade ou exigir recursos excessivos da CPU. O SDXL 1.0 deve funcionar de forma eficaz em GPUs de consumo com VRAM de 8 GB ou instâncias de nuvem amplamente acessíveis.

“O SDXL gera imagens de alta qualidade em praticamente qualquer estilo de arte e é o melhor modelo aberto para fotorrealismo. Imagens distintas podem ser solicitadas sem qualquer ‘sensação’ particular transmitida pelo modelo, garantindo absoluta liberdade de estilo. O SDXL 1.0 é particularmente bem ajustado para cores vibrantes e precisas, com melhor contraste, iluminação e sombras do que seu antecessor, tudo em resolução nativa de 1024 × 1024”, disse Stability AI na postagem do blog.

Lançamento de IA de estabilidade Doodle estável que permite a geração de esboço para imagem

Como usar o SDXL 1.0 em diferentes plataformas

O modelo pode ser acessado por meio da API Stability AI, da página do GitHub e de seus aplicativos de consumidor Clipdrop e DreamStudio. Ele também pode ser encontrado no Amazon SageMaker JumpStart, um hub de ML onde os usuários podem obter soluções, modelos e algoritmos de ML.

O lançamento do SDXL 1.0 veio após o lançamento do SDXL 0.9 somente para pesquisa em julho. A empresa supostamente alterou o modelo para produzir cores mais fiéis e deslumbrantes, além de contraste, iluminação e sombras aprimorados. O processo de imagem também foi aprimorado para gerar imagens com resolução total de 1 megapixel (1024 x 1024) em uma variedade de proporções mais rapidamente.

Alguns dos links necessários para usar o Stable Diffusion XL 1.0 estão listados abaixo. Para começar a usar o SDXL 1.0, confira estas diferentes plataformas:

Devido à sua natureza de código aberto, o SDXL tem ainda mais recursos e potencial do que o Midjourney, embora seu uso eficaz exija um pouco mais de esforço. Talvez o único modelo de imagem disponível comercialmente que corresponda ao grau de qualidade do Midjourney em termos de qualidade seja o SDXL.

Crédito da imagem em destaque: IA de estabilidade

Source: SDXL 1.0 está aqui com recursos aprimorados