Hoje, o Google introduziu uma nova tecnologia de upscaling suportada por IA, em um post de blog chamado High Fidelity Image Generation Using Diffusion Models, que gera imagens de alta fidelidade a partir de imagens de baixa resolução. Uma pesquisa recente do departamento de IA do Google mostra como os novos avanços nesta área tornam possível criar imagens incríveis. O modelo de aprendizado de máquina da empresa é capaz de tirar uma foto quase sem resolução e dimensioná-la para obter detalhes exclusivos.
O Google apresenta uma nova tecnologia de upscaling com suporte de IA
Quando se trata de dimensionar fotografias por IA, existem diferentes métodos. O usado pela empresa é chamado de modelagem de difusão. É um modelo generativo que começou a ser implantado em 2015.
Conforme eles explicam, o sistema pega uma imagem de baixa resolução como entrada e constrói uma imagem de alta resolução por conta própria. Para fazer isso, o Google diz que primeiro treinou a IA para diminuir a resolução das imagens e torná-las extremamente pixeladas. A partir daí, ele “aprende a reverter esse processo, começando com o ruído puro e removendo progressivamente o ruído para alcançar uma distribuição alvo por meio da orientação da imagem de baixa resolução de entrada”.
A ferramenta do Google cria imagens de alta fidelidade usando modelagem de difusão
Com esse método, o Google consegue melhorar principalmente os retratos de pessoas. No entanto, ele vai um passo além e usa uma segunda IA para melhorar ainda mais a qualidade. Por exemplo, primeiro ele transforma uma imagem de 32 x 32 em 64 x 64 e tira essa nova fotografia como referência para ir até 128 x 128 e assim por diante.
Os resultados são, sem dúvida, espetaculares, ele permite que você crie fotos genuinamente detalhadas a partir de praticamente nada. Embora existam alguns pequenos erros, as fotografias parecem reais sem qualquer problema. Na verdade, sem conhecer o contexto, uma pessoa comum provavelmente não identificaria que foi escalada por uma IA.