A versão mais poderosa do principal algoritmo de texto para imagem do Stability AI, SDXL 1.0, foi apresentada. Ele consome menos recursos de processamento, produz imagens com resolução maior que a versão 0.9 e faz menos consultas de texto. É mais útil e eficiente do que nunca com Stable Diffusion XL 1.0!

As ferramentas de inteligência artificial, como o ChatGPT, não produzem apenas texto. Eles agora podem produzir uma variedade de mídia, incluindo música, filmes e imagens. Qualquer pessoa pode fazer praticamente qualquer imagem com o programa AI Stable Diffusion. A utilização de SD e ferramentas comparáveis, que já são amplamente utilizadas, será consideravelmente melhorada por atualizações.

“Com o SDXL 1.0, o ajuste fino do modelo para dados personalizados é mais fácil do que nunca. LoRAs ou pontos de verificação personalizados podem ser gerados com menos necessidade de disputa de dados. A equipe Stability AI está construindo a próxima geração de estrutura, estilo e controles de composição específicos para tarefas, com T2I/ControlNet especializado para SDXL. Esses recursos estão atualmente em pré-visualização beta, mas fique atento para atualizações sobre o ajuste fino”, anunciou a Stability AI.

SDXL 1.0
Stability AI trabalha constantemente para melhorar seu gerador de imagens (Crédito da imagem)

Recursos do SDXL 1.0

Os clientes agora podem se especializar em gerar pessoas ou coisas específicas com apenas cinco imagens, graças a um novo recurso beta de ajuste fino. Este utilitário usa um pequeno número de fotos para polir o SDXL 1.0.

Um dos modelos de imagem de acesso aberto mais eficazes atualmente no mercado, o SDXL 1.0 possui um pipeline de conjunto de modelos de 6,6 bilhões de parâmetros e um modelo básico de 3,5 bilhões de parâmetros. Você pode experimentar o modelo gratuitamente usando o Clipdrop de Stability.ai.


Melhore suas imagens com o novo Stability AI SDXL 0.9


O modelo completo para difusão latente é um pipeline de diferentes especialistas: na primeira fase, o modelo básico gera pacientes (ruidosos), que são posteriormente processados ​​por um modelo de refinamento feito especialmente para as etapas finais de remoção de ruído. Não se esqueça que o modelo base pode ser usado de forma independente como um módulo.

SDXL 1.0
O SDXL 1.0 parece muito poderoso, de acordo com as imagens que a empresa forneceu (Crédito da imagem)

Essa arquitetura de dois estágios permite a resiliência da geração de imagens sem perder velocidade ou exigir recursos excessivos da CPU. O SDXL 1.0 deve funcionar de forma eficaz em GPUs de consumo com VRAM de 8 GB ou instâncias de nuvem amplamente acessíveis.

“O SDXL gera imagens de alta qualidade em praticamente qualquer estilo de arte e é o melhor modelo aberto para fotorrealismo. Imagens distintas podem ser solicitadas sem qualquer ‘sensação’ particular transmitida pelo modelo, garantindo absoluta liberdade de estilo. O SDXL 1.0 é particularmente bem ajustado para cores vibrantes e precisas, com melhor contraste, iluminação e sombras do que seu antecessor, tudo em resolução nativa de 1024 × 1024”, disse Stability AI na postagem do blog.


Lançamento de IA de estabilidade Doodle estável que permite a geração de esboço para imagem


Como usar o SDXL 1.0 em diferentes plataformas

O modelo pode ser acessado por meio da API Stability AI, da página do GitHub e de seus aplicativos de consumidor Clipdrop e DreamStudio. Ele também pode ser encontrado no Amazon SageMaker JumpStart, um hub de ML onde os usuários podem obter soluções, modelos e algoritmos de ML.

O lançamento do SDXL 1.0 veio após o lançamento do SDXL 0.9 somente para pesquisa em julho. A empresa supostamente alterou o modelo para produzir cores mais fiéis e deslumbrantes, além de contraste, iluminação e sombras aprimorados. O processo de imagem também foi aprimorado para gerar imagens com resolução total de 1 megapixel (1024 x 1024) em uma variedade de proporções mais rapidamente.

Alguns dos links necessários para usar o Stable Diffusion XL 1.0 estão listados abaixo. Para começar a usar o SDXL 1.0, confira estas diferentes plataformas:

Devido à sua natureza de código aberto, o SDXL tem ainda mais recursos e potencial do que o Midjourney, embora seu uso eficaz exija um pouco mais de esforço. Talvez o único modelo de imagem disponível comercialmente que corresponda ao grau de qualidade do Midjourney em termos de qualidade seja o SDXL.

Crédito da imagem em destaque: IA de estabilidade

Source: SDXL 1.0 está aqui com recursos aprimorados