Não durma com esses modelos de difusão estável

Modelos de difusão estável são um tipo de modelo generativo que pode ser usado para criar imagens, textos e até músicas realistas. Eles trabalham começando com uma imagem ou texto com ruído aleatório e, em seguida, adicionando detalhes gradualmente, guiados por um processo de difusão. Este processo garante que o modelo não crie imagens irrealistas ou instáveis.

Os modelos de difusão estável funcionam primeiro criando uma imagem de ruído aleatória. Em seguida, utilizam um processo de difusão para refinar gradativamente a imagem, levando em consideração a descrição do texto.

O processo de difusão começa com uma descrição de alto nível da imagem, como “um gato sentado no sofá”. À medida que o processo continua, a descrição torna-se mais detalhada, como “um gato malhado sentado num sofá azul em frente a uma lareira”.

Quais são os melhores modelos de difusão estável?

Foi demonstrado que os modelos de difusão estável são capazes de gerar imagens de alta qualidade de uma variedade de objetos e cenas. Eles também têm sido usados para criar imagens indistinguíveis de fotografias reais.

A seleção dos melhores modelos de difusão estável depende, na verdade, de suas necessidades. Cada modelo Stable Diffusion é especializado para um estilo de geração único e tudo depende do visual a ser gerado.

Difusão Waifu

Desde o seu lançamento, Difusão Waifu tornou-se uma adaptação conhecida do anime Stable Diffusion. Ao continuar treinando o modelo em um conjunto de dados menor que desperta seu interesse, você pode ajustar aquele que foi treinado em um conjunto de dados enorme. Waifu Diffusion v1.4, a versão mais recente, é uma atualização do Stable Diffusion v2 e faz uso de 5.468.025 amostras de imagens de texto do conhecido imageboard de anime Danbooru.

Melhores modelos de difusão estável — Você pode gerar seu próprio waifu com Waifu Diffusion (Crédito da imagem)

Visão realista

O realismo é um dos aspectos mais desafiadores no ensino de máquinas a criar imagens. É difícil para os computadores criarem imagens verdadeiramente realistas devido à nossa capacidade de detectar até as menores imperfeições e sutilezas. No entanto, os resultados fornecidos pelo modelo treinado de Visão Realista são excelentes.

O “pano de fundo branco” foi a única área de dificuldade para a modelo, que conseguiu produzir uma imagem realista de uma mulher que chegou muito perto de corresponder ao nosso desafio. Por outro lado, a vista é de tirar o fôlego e capta bem a beleza do cenário. O gráfico final demonstra a atenção da Realistic Vision aos mínimos detalhes da arte digital.

DreamShaper

DreamShaper é mais parecido com ilustração por causa de seu maravilhoso estilo de arte digital. Este modelo fez um trabalho fantástico no retrato, criando uma peça linda que captura perfeitamente a personalidade e as qualidades estéticas da pessoa retratada. No campo, o DreamShaper foi capaz de criar obras de arte lindas e vibrantes com detalhes intrigantes. A imagem possui uma variedade de formas geométricas que lhe conferem profundidade e dimensão, além de cores atraentes.

Este modelo é o que você precisa se quiser que seus modelos de difusão estável sejam capazes de produzir gráficos. Além disso, você pode alterar algumas configurações para fazer com que os produtos acabados pareçam obras de arte digitais.

Qualquer modelo

O modelo Qualquer coisa foi desenvolvido principalmente para reproduzir cenas de estilo anime. Isto é particularmente evidente no caso do nosso desafio de retrato, que deu origem a um jovem protagonista com uma variedade de escolhas sutis de design. Qualquer coisa, apesar do aspecto cômico, criava um cenário maravilhoso com tons suaves. O exemplo também ilustrou a capacidade do Anything de criar estruturas e componentes complexos.

Qualquer assunto pode servir de base para obras de arte no estilo anime. Aconselhamos vivamente que experimente o VAE para tirar o máximo partido deste fantástico modelo de Difusão Estável.

Como instalar modelos de difusão estável

Para usar modelos de difusão estáveis, primeiro você precisa adquirir as ferramentas necessárias ou, para ser mais preciso, a interface da web Automatic111 SD. Para instalar o Automatic111, você precisará de:

Depois de fazer isso, você pode seguir estas etapas para instalar o Automatic111:

Clone o repositório Automatic111
Abra uma janela de terminal e navegue até o diretório onde deseja instalar o Automatic111. Em seguida, execute o seguinte comando: git clone https://github.com/AUTOMATIC111/web-ui.git
Execute Automático111. Na janela do terminal, navegue até o diretório onde você clonou o repositório Automatic111
Em seguida, execute o seguinte comando: python webui.py

Isso iniciará a interface da web do Automatic111. Você pode usar a interface da web para criar imagens e texto com o modelo de difusão estável.

Depois de fazer isso, basta visitar Civit.AI e baixar um modelo que você gostou e ir até a pasta “Models” dentro do diretório de instalação do Stable Diffusion e colar o modelo lá.

Para usar o modelo, você deve abrir a interface da web SD do Automatic111 e selecionar o modelo no canto superior esquerdo. Lembre-se de que cada modelo é bom em gerar um estilo único, portanto, experimentar diferentes modelos de Difusão Estável para gerações únicas é a chave para o sucesso na criação de visuais impressionantes usando Difusão Estável.

Depois de escolher um modelo de nossa lista dos melhores modelos de difusão estável, aprenda como usar a difusão estável ControlNet para gerar imagens melhores.

Crédito da imagem em destaque: chandlervid85/Freepik.

Source: Não durma com esses modelos de difusão estável