Nos últimos dois anos, os geradores de imagens por IA têm causado um verdadeiro frenesi.
Se você navega pelas redes sociais ou lê matérias de sites de tecnologia já deve ter se deparado com imagens geradas por IA.
Elas estão por toda parte e o motivo é claro: as ferramentas necessárias para criá-las estão não apenas excelentes, mas também acessíveis ao público.
Quer entrar na onda ou incorporar recursos potencializados por IA aos fluxos de trabalho da sua empresa? Os aplicativos desta lista são exatamente o que você precisa.
Desde o Google Deep Dream em 2015, acompanhamos o progresso dos geradores de imagens por IA. E é impressionante ver o quanto eles evoluíram.
Vou deixar de lado as discussões complicadas sobre mérito artístico, a substituição ou complementação dos artistas por essas ferramentas e as questões de direitos autorais nos dados de treinamento.
Prefiro focar no fato de que esses geradores agora são capazes de produzir resultados fascinantes a partir de uma vasta gama de prompts de texto.
Vale a pena dedicar algumas horas para explorar esses aplicativos de IA de texto para imagem.
Mesmo que seja só para admirar a técnica por trás deles, prepare-se: você certamente verá mais dessas criações nos próximos meses e anos.
- Melhores Geradores de Imagem IA
- Como funcionam os Geradores de Imagens por IA?
- O que define o melhor Gerador de Imagens por IA?
- O Melhor Gerador de Imagens com IA para Facilidade de Uso: DALL·E 3
- O Gerador de Imagens com IA de Melhores Resultados: Midjourney
- O Melhor Gerador de Imagens com IA para Personalização e Controle: Stable Diffusion
- O Melhor Gerador de Imagens com IA para Integrar Imagens Geradas por IA em Fotos: Adobe Firefly
- O Melhor Gerador de Imagens com IA para Imagens Comercialmente Seguras: IA Generativa da Getty Images
- E os outros geradores de imagens com IA?
- Implicações legais e éticas de imagens geradas por IA
- O que vem a seguir para os geradores de imagens com IA?
Melhores Geradores de Imagem IA
- DALL·E 3: O gerador de imagens por IA mais fácil de usar
- Midjourney: Os melhores resultados em imagens por IA
- Stable Diffusion: Maior personalização e controle das suas imagens por IA
- Adobe Firefly: Para integrar imagens geradas por IA em fotos
- Generative AI da Getty: Para imagens seguras e utilizáveis comercialmente
Como funcionam os Geradores de Imagens por IA?
Todos esses geradores convertem um prompt de texto em uma imagem correspondente, abrindo um leque de possibilidades incríveis.
Desde "uma pintura impressionista de um homem montando um alce em uma praia deserta" até "uma fotografia de um elefante na lua", as únicas limitações são sua imaginação, a capacidade da IA de entender seu prompt e os filtros de conteúdo para evitar plágios e conteúdos inapropriados.
A maioria desses geradores funciona de maneira semelhante, treinando uma rede neural com milhões ou bilhões de pares de imagem e texto, o que permite que a IA "aprenda" sobre diversos objetos e conceitos.
A etapa seguinte é a renderização da imagem gerada pela IA, processo realizado através de uma técnica chamada difusão, que começa com um campo aleatório de ruído e o vai ajustando para corresponder ao prompt dado.
Antes de prosseguirmos, é importante dizer que, apesar de impressionantes, essas ferramentas ainda não substituem totalmente uma sessão fotográfica profissional.
No entanto, para a criação de imagens únicas ou peculiares, elas podem ser extremamente úteis.
O que define o melhor Gerador de Imagens por IA?
Antes, esses geradores eram mais uma novidade do que uma ferramenta revolucionária. No entanto, nos últimos dois anos, houve uma evolução significativa.
Apesar da disponibilidade limitada devido ao alto custo computacional necessário, os grandes nomes como DALL·E 3, Midjourney e Stable Diffusion, além de modelos de gigantes da IA como Google, Meta, Adobe e NVIDIA, se destacam.
Além da facilidade de uso, considerei a personalização, as opções de controle, o modelo de precificação e, claro, a qualidade dos resultados.
Apesar de todos estarem tecnicamente em fase beta, o potencial e a capacidade de produzir resultados impressionantes são enormes.
O Melhor Gerador de Imagens com IA para Facilidade de Uso: DALL·E 3
Vantagens do DALL·E 3:
- Facilidade de uso incrível
- Incluído no ChatGPT Plus, oferecendo um excelente custo-benefício em inteligência artificial
Desvantagens do DALL·E 3:
- Os controles do ChatGPT podem ser inconsistentes
- O valor de $20/mês pode ser considerado alto se você não estiver interessado no GPT
O DALL·E 3 é, sem dúvidas, uma das ferramentas mais renomadas entre os geradores de imagens com IA, e não é à toa.
Seu antecessor, o DALL·E 2, já tinha se destacado por criar imagens surpreendentemente interessantes e se tornou viral ao estar acessível a um grande número de usuários.
Agora, o DALL·E 3 avança ainda mais, oferecendo resultados mais realistas, interessantes e consistentes para qualquer comando dado.
Antes, parecia que a OpenAI estava perdendo espaço para os concorrentes nesse segmento, mas o DALL·E 3 veio para colocar a empresa de volta na disputa.
A maior vantagem do DALL·E 3 é sua simplicidade de uso. Basta dizer ao ChatGPT ou ao Bing o que você deseja ver, e em instantes, você terá à disposição de duas a quatro variações geradas pela IA para escolher.
Ele utiliza o entendimento de linguagem do GPT-4 para expandir seus comandos, garantindo resultados únicos, e você sempre pode pedir mais opções.
Embora a OpenAI não ofereça mais testes gratuitos do DALL·E 3, a Microsoft disponibiliza essa opção. Encontrei o Copilot um pouco mais complicado de usar, e ele não realiza alterações com base em comandos de acompanhamento, mas é difícil argumentar contra o preço gratuito.
No entanto, a melhor maneira de usar o DALL·E 3 é por meio do ChatGPT. Se você é assinante do ChatGPT Plus, pode usar à vontade, respeitando o limite do GPT-4 de 40 mensagens a cada três horas.
O DALL·E 3 ainda não possui todos os recursos do DALL·E 2, como inpainting e outpainting, mas você pode pedir ao ChatGPT para fazer alterações nas suas imagens, e ele reexecutará os comandos com suas adições.
Às vezes, isso parece mágica, com o ChatGPT executando exatamente o que você pede. Outras vezes, parece que você está trabalhando com um estagiário excessivamente zeloso, que às vezes age por conta própria.
Se você deseja mais controle, pode experimentar outros aplicativos desta lista ou continuar usando o DALL·E 2.
Além do DALL·E 3 por meio do ChatGPT e do aplicativo web do DALL·E 2, a OpenAI oferece uma API que permite aos desenvolvedores criar aplicativos integrados aos dois modelos do DALL·E.
Preços do DALL·E: O DALL·E 3 está incluso no ChatGPT Plus por $20/mês e disponível gratuitamente pelo Microsoft Copilot; o DALL·E 2 custa $15 por 115 créditos de imagem. A precificação da API é mais complexa, começando em $0.016/imagem.
O Gerador de Imagens com IA de Melhores Resultados: Midjourney
Vantagens do Midjourney:
- Gera consistentemente as imagens mais atraentes criadas por IA
- A comunidade é uma ótima fonte de inspiração
Desvantagens do Midjourney:
- Só pode ser usado por meio do Discord, o que é peculiar
- As imagens geradas são públicas por padrão
- Os testes gratuitos estão atualmente suspensos
O Midjourney produz consistentemente meus resultados favoritos entre todos os geradores de imagens desta lista.
As imagens criadas são mais coerentes, com melhores texturas e cores, e, no geral, os resultados são mais interessantes e visualmente atraentes.
Especialmente pessoas e objetos do mundo real parecem mais realistas e naturais do que com outros geradores de imagens com IA, pelo menos sem muitos comandos específicos, e as versões mais recentes até conseguem representar mãos de forma razoavelmente correta.
É significativo que tenha sido o primeiro gerador de imagens com IA a ganhar uma competição de arte.
Por enquanto, o Midjourney tem uma peculiaridade importante: a versão beta só está acessível por meio do Discord.
Depois de ingressar no servidor do Discord do Midjourney ou convidar o bot do Midjourney para um servidor que você controla, você pode inserir um comando digitando /imagine [o que você deseja ver].
O bot então gera quatro variações do seu comando, que você pode baixar, aumentar a resolução, reeditar e mais.
A boa notícia é que isso está prestes a mudar. O Midjourney está testando um aplicativo web em fase alfa.
A empresa afirma que ainda dará suporte ao Discord a longo prazo, e certamente haverá algumas peculiaridades que permanecerão, mas é ótimo que o melhor gerador de imagens com IA em breve estará amplamente disponível.
Quanto às peculiaridades: por padrão, todas as imagens que você gera são postadas publicamente no Discord do Midjourney e podem ser visualizadas em seu perfil no site.
Isso confere um aspecto comunitário interessante, mas significa que qualquer pessoa interessada pode ver o que você está criando.
Embora isso não seja necessariamente um problema para artistas, pode ser um ponto de ruptura se você pretende usar o Midjourney para fins comerciais.
Se tudo isso parece confuso, não se preocupe. Os documentos de ajuda do Midjourney são realmente úteis e orientam você desde o início até todos os seus recursos avançados, como as diferentes versões do modelo, aumentar a resolução das suas imagens, mesclar várias imagens e usar diferentes parâmetros para controlar as coisas.
Uma vez que você entenda as diferentes opções, os resultados que você pode obter são genuinamente incríveis.
Os testes gratuitos do Midjourney estão atualmente suspensos devido ao número de pessoas tentando usá-lo, mas ocasionalmente são restabelecidos por alguns dias.
Se você perder uma janela de teste gratuito, o Plano Básico começa em $10/mês e vem com 3.3 horas de tempo de GPU por mês, ou cerca de 200 imagens.
Você também tem a opção de comprar tempo de GPU adicional, e pode usar suas imagens comercialmente.
Preços do Midjourney: A partir de $10/mês para o Plano Básico, que permite gerar cerca de 200 imagens/mês e fornece direitos de uso comercial.
O Melhor Gerador de Imagens com IA para Personalização e Controle: Stable Diffusion
Vantagens do Stable Diffusion:
- O DreamStudio (aplicativo web do Stable Diffusion) é o único grande gerador de imagens com IA que ainda oferece créditos gratuitos
- O aplicativo é incrivelmente acessível e personalizável; superpotente com resultados geralmente excelentes
Desvantagens do Stable Diffusion:
- Curva de aprendizado mais acentuada do que alguns outros geradores de arte com IA
- As ferramentas de edição no DreamStudio não são muito intuitivas
Ao contrário do DALL·E e do Midjourney, o Stable Diffusion é de código aberto. Isso significa que qualquer pessoa com as habilidades técnicas necessárias pode baixá-lo e executá-lo localmente em seu próprio computador.
Também significa que você pode treinar e ajustar o modelo para propósitos específicos. Quase todos os serviços que usam IA para gerar retratos artísticos, retratos históricos, renderizações arquitetônicas e tudo mais usam o Stable Diffusion dessa forma.
Se você tem as habilidades e quer construir algo incrível com IA, o Stable Diffusion é a melhor maneira de fazer isso. Há até uma API e um serviço chamado Clipdrop que o divide em uma série de ferramentas.
Mas o Stable Diffusion também está disponível em um poderoso aplicativo público chamado DreamStudio, construído por seus desenvolvedores, a Stability AI. (Como tudo nesta lista, está em beta.)
O DreamStudio oferece um enorme controle sobre os vários aspectos da geração de uma imagem com IA.
Quando você digita seu comando, há controles deslizantes que permitem determinar o tamanho final da imagem, quão de perto ela corresponde ao comando que você deu, quantas etapas o modelo de difusão leva e quantas imagens são geradas.
Você também pode selecionar qual versão do algoritmo ele usa (a mais recente é SDXL 1.0), e até mesmo inserir uma semente específica para obter resultados repetíveis (caso contrário, eles são gerados aleatoriamente).
O DreamStudio também possui inpainting e outpainting, embora eu nunca tenha tido muito sucesso com eles.
O DreamStudio funciona com um sistema de créditos. Quando você se inscreve, recebe 25 créditos gratuitos, que são bons para cerca de 30 comandos ou 120 imagens com as configurações padrão.
Usar um modelo mais potente, gerar imagens maiores ou mais imagens, ou iterá-las através de mais etapas consumirá seus créditos rapidamente.
Uma vez que você tenha terminado, precisará comprar mais, começando em $10 por 1.000 créditos.
No geral, o DreamStudio e o Stable Diffusion oferecem a maior personalização e controle sobre todo o processo de geração de imagens com IA.
Eles permitem que você mergulhe tão fundo na IA quanto quiser - e até construa seus próprios serviços de IA.
E se você esgotar seu teste gratuito rapidamente, também pode experimentar os mesmos modelos Stable Diffusion gratuitamente através do Clipdrop - embora eles tenham marca d'água e você tenha menos controle.
Preços do DreamStudio: Gratuito para 25 créditos. A partir de $10 por 1.000 créditos.
O Melhor Gerador de Imagens com IA para Integrar Imagens Geradas por IA em Fotos: Adobe Firefly
A Adobe está incorporando ferramentas de IA em seus aplicativos há mais de 15 anos, então não é surpresa que ela tenha um dos geradores de texto para imagem mais poderosos - pelo menos em termos de como se integra com outras ferramentas.
Você pode experimentar seu modelo de IA, o Firefly, na web gratuitamente ou por meio do Adobe Express, mas ele é mais eficaz na versão mais recente do Photoshop.
O Firefly tem alguns truques na manga. Além de ser capaz de gerar novas imagens a partir de uma descrição de texto detalhada, ele pode criar efeitos de texto a partir de um comando escrito (pense na palavra "TORRADA" escrita com letras que parecem feitas de torrada), recolorir obras de arte vetoriais ou adicionar elementos gerados por IA às suas imagens. Você pode testar tudo isso por meio do aplicativo web, mas é essa última funcionalidade onde o Firefly se destaca.
Tomado puramente como um gerador de texto para imagem, os resultados do Firefly podem ser bastante variáveis.
Ele pode igualar ou superar o DALL·E ou o Stable Diffusion para alguns comandos, mas para outros, questiono o que ele estava tentando fazer.
Por outro lado, sua integração com o Photoshop, o editor de imagens padrão da indústria, é de outro nível.
A funcionalidade específica é chamada de Preenchimento Generativo. A ideia é que você use as ferramentas regulares do Photoshop para selecionar uma área da sua imagem e, então, apenas clicando em um botão e digitando um comando, você pode substituí-la por outra coisa.
Crucialmente, o Preenchimento Generativo entende o contexto da sua imagem. Na captura de tela acima, você pode ver que o Photoshop combinou o desfoque de profundidade de campo para a floresta que adicionei usando o Preenchimento Generativo. Parece coeso.
Tanto quanto o DALL·E e o Stable Diffusion iniciaram a conversa sobre AIs geradoras de imagens, o Firefly da Adobe é a primeira implementação de um gerador de fotos com IA que realmente sugere o que está por vir.
Não é um truque, mas uma ferramenta disponível para os milhões de profissionais que usam os aplicativos da Adobe todos os dias.
Preços do Firefly: O Firefly usa um sistema de créditos e está disponível como parte de várias assinaturas do Creative Cloud; o Photoshop está disponível a partir de $19.99/mês como parte do Plano de Fotografia do Creative Cloud, que vem com 500 créditos generativos.
O Melhor Gerador de Imagens com IA para Imagens Comercialmente Seguras: IA Generativa da Getty Images
Vantagens da Getty:
- Surpreendentemente eficaz na geração de fotos semelhantes a imagens de banco de imagens
- A Getty o indeniza de quaisquer reivindicações legais resultantes do uso das imagens que gera
Desvantagens da Getty:
- Menos criativo e divertido de usar
- Não pode competir com o Midjourney, DALL·E 3 ou Stable Diffusion em termos de qualidade geral
Como discutimos, os geradores de imagens com IA são... controversos. Além da ética de usá-los, a situação legal é incrivelmente obscura.
O Escritório de Direitos Autorais dos EUA geralmente decidiu que as imagens geradas por IA não podem ser protegidas por direitos autorais, então seus concorrentes poderiam, teoricamente, pegar suas imagens e usá-las sem repercussões.
Honestamente, se você administra um negócio, evitar AIs generativas é uma estratégia compreensível. Mas se você realmente deseja usá-las, então uma plataforma como a Getty Images, que promete que seu gerador de imagens com IA Generativa está livre dessas dores de cabeça, é a melhor opção.
A IA Generativa da Getty Images, que você pode acessar facilmente via iStock, é surpreendentemente boa - especialmente na criação de fotos semelhantes a imagens de banco de imagens.
Testei com clássicos como "mulher rindo sozinha com salada", e os resultados foram bastante sólidos. À primeira vista, as melhores opções eram indistinguíveis de fotos de banco de imagens reais.
Para comandos mais criativos, como "uma pintura impressionista de um homem montando um alce em uma praia deserta", e qualquer coisa envolvendo estilos de arte específicos, foi um pouco mais complicado, para dizer o mínimo.
Suspeito que isso se deva aos dados de treinamento. Em vez de uma coleção questionável de alguns bilhões de imagens, a IA Generativa usa o NVIDIA Picasso e foi treinada em grande parte no catálogo de imagens de banco de imagens da Getty.
Segundo a Getty, tudo isso foi feito corretamente, e existe um programa para compensar os artistas cujo trabalho foi usado para treinar o modelo.
Embora isso seja louvável, afeta o tipo de coisas que você pode gerar. A IA Generativa não criará nada que apresente uma pessoa real, uma marca registrada ou qualquer outra coisa que potencialmente viole as leis de propriedade intelectual.
Eu nem mesmo consegui que ela gerasse uma pintura no estilo de Vermeer, apesar de ele ter morrido em 1675. No geral, isso torna a ferramenta da Getty menos divertida e flexível de usar - mas muito mais prática para empresas com um departamento jurídico.
Preços da IA Generativa da Getty: Disponível como IA Generativa da iStock por $14.99 por 100 gerações de IA.
E os outros geradores de imagens com IA?
Você provavelmente notou que esta lista é bastante curta - eu só escolhi cinco geradores de imagens com IA.
Como mencionei acima, isso ocorre porque estou olhando para os modelos de IA em si - não necessariamente para os aplicativos que são construídos em cima deles.
Implicações legais e éticas de imagens geradas por IA
As imagens geradas por IA estão em toda parte agora, mas isso não significa que não devemos fazer perguntas sobre como elas devem (ou não) ser usadas.
Não há leis claras em vigor em torno de imagens geradas por IA. E isso vale para ambos os lados da moeda: como exemplo o Escritório de Direitos Autorais dos EUA sugere que o conteúdo gerado por IA não é protegido por direitos autorais, e não há regras para proteger os artistas cujo trabalho foi usado para treinamento de IA. (É por isso que o Firefly foi treinado apenas em imagens licenciadas e conteúdo de domínio público.)
Isso já levou a processos judiciais. A Stability AI, por exemplo, está enfrentando processos da Getty Images e dos próprios artistas por uso não autorizado de suas imagens, e há um processo coletivo contra vários geradores de imagens com IA.
Você provavelmente não terá problemas ao usar imagens geradas por IA para algumas postagens em redes sociais ou de blog, mas como ainda não há uma linha traçada na areia, pode ser arriscado desenvolver uma estratégia inteira em torno de arte gerada por IA.
Então, há a questão do viés. Até agora, a IA tem muitos dos mesmos vieses que os humanos, e isso pode levar a tudo, desde a representação de estereótipos até conteúdo preconceituoso.
Eu mesmo presenciei isso com os resultados que obtive de alguns dos aplicativos enquanto os testava, embora outras ferramentas tomem medidas deliberadas para adicionar diversidade às imagens que geram.
Cabe a nós, como humanos, evitá-lo, revisando o conteúdo gerado por IA em busca de viés e refinando nossos comandos para eliminar esse viés tanto quanto possível.
O que vem a seguir para os geradores de imagens com IA?
A geração de imagens com IA é um espaço em rápida evolução. É incrível ver o quão longe os diferentes motores chegaram cada vez que atualizo este artigo.
E à medida que um número maior de pessoas os usa, os desenvolvedores estão obtendo enormes quantidades de dados para treinar e refinar seus modelos ainda mais, então podemos esperar que as coisas continuem a melhorar.
Deixe um comentário
Relacionado