Um modelo de aprendizado de máquina de texto para imagem chamado Stable Diffusion AI art generator foi desenvolvido em colaboração com EleutherAI, LAION e StabilityAI para gerar imagens digitais a partir de descrições em linguagem natural.

A criação de arte pela IA não é nova. No entanto, softwares como DALL-E 2, Midjourney AI e Stable Diffusion, lançados este ano, possibilitaram que até mesmo os artistas menos habilidosos criassem obras de arte complexas, abstratas ou realistas simplesmente digitando algumas palavras em uma caixa de texto.

Estabilidade O modelo de geração de imagem de código aberto da IA ​​está no mesmo nível do DALL-E 2 em termos de qualidade. Além disso, introduziu o DreamStudio, um site comercial que fornece tempo de computação para a criação de imagens de difusão estável. A difusão estável, ao contrário do DALL-E 2, pode ser usada por qualquer pessoa e, como o código é de código aberto, os projetos podem ser construídos com poucas restrições.

O que é o gerador de arte Stable Diffusion AI?

A Stability AI lançou o Stable Diffusion, um gerador de arte de IA de código aberto, em 22 de agosto. O Python é usado para criar o Stable Diffusion, e o conceito de linguagem de transformador é usado. Qualquer sistema operacional que suporte kernels Cuda pode usá-lo.

Graças ao paradigma de síntese de imagem de difusão estável de código aberto, qualquer pessoa com um PC e uma boa GPU pode construir praticamente qualquer realidade visual que possa imaginar. Ele pode duplicar praticamente qualquer estilo visual se você der um texto descritivo, e os resultados aparecem na tela milagrosamente.

Difusão estável: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

Ao contrário de métodos como o DALL-E, o Stable Diffusion disponibiliza seu código fonte. A licença proíbe algumas situações de uso arriscado.

A ética da IA ​​foi atacada por oponentes, que afirmam que o modelo pode ser usado para criar “deepfakes” e questionam se é apropriado criar imagens usando um modelo treinado em um conjunto de dados que contém conteúdo protegido por direitos autorais sem o consentimento dos artistas.

O conjunto de treinamento para difusão estável foi um subconjunto do conjunto de dados LAION-Aesthetics V2. Ele foi treinado em 256 GPUs Nvidia A100 no modo de compras por US$ 600.000.

A Stability AI, empresa que sustenta a Stable Diffusion, está em negociações para buscar capital em uma avaliação de até US$ 1 bilhão em setembro de 2022.

Requisitos de download de difusão estável

Em 2022, um PC para jogos típico oferecerá suporte à difusão estável, mas seu telefone e a maioria dos laptops não. Os pré-requisitos para download do Stable Diffusion que você deve atender são os seguintes:

  • Uma GPU com ao menos 6 gigabytes (GB) de VRAM
    • Isso inclui as GPUs NVIDIA mais modernas
  • 10 GB (ish) de espaço de armazenamento em seu disco rígido ou unidade de estado sólido
  • O instalador do Miniconda3
  • Os arquivos de difusão estável do GitHub
  • Os Últimos Checkpoints (Versão 1.4, no momento da redação, mas 1.5 deve ser lançado em breve)
  • O instalador do Git
  • Windows 8, 10 ou 11
    • A difusão estável também pode ser executada no Linux e no macOS

Qual é o tamanho do gerador de arte Stable Diffusion AI?

Você precisa de aproximadamente 10 GB de espaço de armazenamento em seu disco rígido ou unidade de estado sólido.

Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

Você pode utilizar IA no meio da jornada ou outros geradores de IA baseados na web se você não tiver o hardware necessário.

Como executar o gerador de arte Stable Diffusion AI?

Estas são as etapas de como executar o gerador de arte Stable Diffusion AI:

Vamos dar uma olhada em como você pode fazê-los.

Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

Instalar o Git

Os programadores podem gerenciar várias versões do software que estão desenvolvendo com a ajuda da tecnologia chamada Git. Eles podem reter diferentes versões do software em que estão trabalhando em um repositório compartilhado, ao mesmo tempo em que permitem que outros desenvolvedores contribuam com o projeto.

Se você não é um desenvolvedor, o Git fornece uma maneira simples de acessar e baixar esses projetos. Vamos aplicá-lo nesta circunstância. Executando o Instalador do Windows x64 que pode ser obtido no site do Git é necessário instalar o Git.

Você terá a opção de definir várias opções enquanto a instalação estiver em execução; deixe-os todos em suas configurações padrão. É importante visitar a página de opções “Ajustando seu ambiente PATH”. Apenas “Git da linha de comando e também de software de terceiros” deve ser escolhido.

Instalar Miniconda3

A difusão estável faz uso de uma variedade de bibliotecas Python. Se você não estiver familiarizado com o Python, não se preocupe muito com isso; basta entender que as bibliotecas são apenas pacotes de software que seu computador pode usar para executar tarefas específicas, como editar uma imagem ou realizar aritmética desafiadora.

Miniconda3 é essencialmente uma ferramenta de conveniência. Ele possibilita que você gerencie todas as bibliotecas necessárias para que o Stable Diffusion funcione sem trabalho tedioso. Isso também afetará como usamos a difusão estável em cenários do mundo real.

Visite a página de download do Miniconda3 e escolha “Miniconda3 Windows 64-bit” para obter a versão mais recente.

Clicar duas vezes no executável após baixá-lo iniciará a instalação. Comparado ao Git, a instalação do Miniconda3 envolve menos cliques na página. No entanto, você deve ter cuidado ao tomar esta decisão:

Certifique-se de que “Todos os usuários” esteja escolhido antes de pressionar o próximo botão e finalizar a instalação.

Você será solicitado a reiniciar o computador após instalar o Miniconda3 e o Git.

Baixe o repositório GitHub de difusão estável e o ponto de verificação mais recente

Depois de instalar o software necessário, podemos baixar e configurar o Stable Diffusion.

Baixando o Último ponto de verificação deve vir em primeiro lugar. Para baixar o ponto de verificação, você deve primeiro criar uma conta, mas tudo o que eles exigem é seu nome e endereço de e-mail.

O link que diz “sd-v1-4.ckpt” iniciará o download. O outro arquivo, “sd-v1-4-full-ema.ckpt”, é quase duas vezes maior, mas pode produzir melhores resultados. Você pode usar qualquer um.

O próximo passo é obter Difusão Estável do GitHub. Escolha o botão verde “Código” e clique em “Baixar ZIP”. Você pode usar este link de download direto também.

Agora que descompactamos os arquivos do Stable Diffusion, precisamos criar alguns diretórios para descompactá-los. Clique no botão Iniciar, digite “miniconda3” na caixa de pesquisa do Menu Iniciar e escolha “Abrir” ou “Enter”.

Vamos criar uma pasta chamada “stable-diffusion” usando a linha de comando. Depois de colar a próxima seção de código na caixa Miniconda3, pressione Enter.

Se tudo correr como planejado, a janela Miniconda3 aparecerá. Mantenha o Miniconda3 aberto porque precisaremos dele novamente em breve.

Use seu arquivador de arquivos favorito para abrir o arquivo ZIP “stable-diffusion-main.zip” que você baixou do GitHub. O Windows pode abrir arquivos ZIP por conta própria como alternativa, se você não tiver um. Enquanto mantém o arquivo ZIP aberto na primeira janela do Explorador de Arquivos, abra uma segunda janela e navegue até a pasta “C:stable-diffusion” que acabamos de criar.

Arraste e solte a pasta “stable-diffusion-main” para a pasta “stable-diffusion” do arquivo ZIP.

Volte ao Miniconda3 e cole os seguintes comandos na janela:

cd C:stable-diffusionstable-diffusion-main
conda env create -f environment.yaml
conda activate ldm
mkdir modelsldmstable-diffusion-v1

Continue com o procedimento. Como alguns arquivos são mais do que um gigabit, o download pode levar algum tempo. Se você interromper o processo acidentalmente, deverá excluir a pasta do ambiente e reiniciar o conda env create -f environment.yaml. Nesse cenário, após apagar a pasta “ldm” de “C:Users(Your User Account).condaenvs”, execute o comando anterior.

A última etapa da instalação está concluída. Utilizando o Explorador de Arquivos, copie o arquivo do ponto de verificação (sd-v1-4.ckpt) e cole-o na pasta “C:stable-diffusionstable-diffusion-mainmodelsldmstable-diffusion-v1”.

Clique com o botão direito do mouse em “sd-v1-4.ckpt” após a transferência do arquivo e selecione “Renomear” no menu de contexto. Digite “model.ckpt” no campo destacado e pressione Enter para renomear o arquivo.

Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

Acabamos com isso agora. A difusão estável está agora disponível para uso. Ainda como?

Guia de difusão estável: como usar o gerador de arte Stable Diffusion AI?

Como funciona a difusão estável? Siga estas etapas para o melhor uso do gerador de arte Stable Diffusion AI:

  • Ative o ambiente ldm
  • Alterar o diretório
  • Use txt2img.py e escreva seu texto
  • Aguarde o processo
  • Confira os resultados

Toda vez que você quiser usar a difusão estável, você deve ativar o ambiente ldm que projetamos. Digite conda activate ldm na janela Miniconda3 e pressione “Enter”. Um ambiente ldm ativo é indicado pelo (ldm) no lado esquerdo.

Devemos primeiro alterar o diretório (daí o commandcd) para “C:stable-diffusionstable-diffusion-main” antes de podermos criar qualquer foto. Adicione o parâmetro de linha de comando cd C:stable-diffusionstable-diffusion-main.

Vamos converter prompts de texto em 512512 visuais usando uma ferramenta chamada txt2img.py.

Você verá uma barra de progresso em seu console à medida que as fotos são geradas.

C:stable-diffusionstable-diffusion-mainoutputstxt2img-samplesamostras” é a localização de todas as imagens produzidas.

Exemplos e prompts de difusão estável

A seguir estão alguns dos melhores exemplos do gerador de arte Stable Diffusion AI e seus prompts:

Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

Pronto: Forest Wanderer de Dominic Mayer, Anthony Jones, Loish, estilo pictórico de Gerald Parel, Craig Mullins, Marc Simonetti, Mike Mignola, ilustração de cores planas, brilhante e colorido, alto contraste, mitologia, cinematográfico, detalhado, atmosférico, épico, arte conceitual, Pintura fosca, Senhor dos anéis, Game of Thrones, eixos de iluminação, névoa, , fotorrealismo, arte conceitual, luz volumétrica, épico cinematográfico + regra dos terços | 35mm| renderização octane, 8k, corona render, arte conceitual do filme, renderização octane, 8k, renderização corona, cinemático, tendências no artstation, arte conceitual do filme, composição cinematográfica, ultra detalhado, realista, hiperrealista, iluminação volumétrica, 8k –ar 3:1 – teste – uplight

Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

Pronto: Ambiente castelo nathria em world of warcraft :: estilo gótico castelo totalmente desenvolvido : cinematográfico, chovendo, noturno, detalhado, épico, arte conceitual, pintura fosca, eixos de iluminação, névoa, fotorrealista, arte conceitual, luz volumétrica, épico cinematográfico + regra de terços, arte conceitual do filme, 8k, cinematográfico, tendências no artstation, arte conceitual do filme, composição cinematográfica, ultra detalhado, realista, hiper realista, iluminação volumétrica, 8k –ar 3:1

Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

Pronto: retrato claro de um conceito de super-herói entre homem-aranha e batman, cottagecore !!, fundo hiper detalhado, conceito de personagem, corpo inteiro, pose dinâmica, intrincado, altamente detalhado, pintura digital, artstation, arte conceitual, suave, foco nítido, ilustração, arte de Artgerm e Greg Rutkowski e Alphonse Mucha

O que é Arte Léxica?

Lexica é uma galeria e mecanismo de busca de arte criada com Stable Diffusion.

Você pode checar Lexica, um site para um mecanismo de pesquisa que usa imagens geradas por IA de difusão estável. O Lexica contém prompts para imagens geradas automaticamente.

Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar
Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar

A difusão estável é de código aberto?

Sim. As imagens usadas no Stable Diffusion, que foi open source em 22 de agosto, foram criadas por uma rede neural treinada em milhões de imagens recuperadas da Internet.

Um novo rival surgiu recentemente para DALL-E e Midjourney AI. Acima de tudo, é grátis! Veremos como os conflitos do gerador de arte de IA afetam as coisas.

Source: Gerador de arte Stable Diffusion AI: prompts, exemplos e como executar