Como Criar Imagens Gratuitamente com IA?

Nesta matéria vou te ensinar como criar imagens gratuitamente com Inteligência Artificial.

Para isto, vamos utilizar o modelo atual mais avançado da OpenAI (o que é ótimo).

A OpenAI anunciou recente (no X – Twitter) uma atualização no ChatGPT que permite que todos os usuários, incluindo aqueles que utilizam a versão gratuita, criem imagens diretamente através da integração com o seu melhor modelo disponível (DALL-E 3).

We’re rolling out the ability for ChatGPT Free users to create up to two images per day with DALL·E 3.

Just ask ChatGPT to create an image for a slide deck, personalize a card for a friend, or show you what something looks like.

Nossa tradução: Estamos lançando a capacidade de usuários gratuitos do ChatGPT criarem até duas imagens por dia com o DALL·E 3.

Basta pedir ao ChatGPT para criar uma imagem para um slide, personalizar um cartão para um amigo ou mostrar como algo se parece.

Fonte: OpenAI post no X.

De acordo com as informações que obtivemos, uma conta gratuita pode criar 2 imagens por dia.

Então vem comigo que vou te mostrar tudo que você precisa saber para criar imagens com estilo profissional.

Não sabe o que é Inteligência Artificial? Clique Aqui.

1. Crie uma Conta Gratuita para Gerar Imagens

Até o momento de publicação desta matéria, para que você consiga criar imagens gratuitamente acessando o DALL E 3 pelo ChatGPT, é preciso que você crie uma conta com um e-mail de sua preferência.

Você pode acessar a plataforma clicando aqui.

O processo é simples e intuitivo, após o login, você já estará diante do ambiente de conversa com o chatbot.

Print da tela do ChatGPT retirado pelo autor ago2024.

2. Entendendo o Básico Sobre Criação de Imagens com o DALL-E 3

O DALL-E 3 é uma ferramenta de inteligência artificial que transforma descrições textuais em imagens.

Quando for criar seu prompt, evite ser muito genérico.

A IA do DALL-E 3 funciona melhor quando recebe instruções claras e detalhadas.

Se possível, compare o que você quer com algo conhecido.

Por exemplo, se você deseja que a imagem tenha um estilo semelhante ao de uma obra de arte específica, mencione isso no prompt.

Isso ajuda o DALL-E 3 a capturar o estilo visual que você está imaginando.

3. Direto no Que Interessa: Como Fazer o Melhor Prompt Para a Criação de Imagens?

Chamamos de engenharia de prompt (EP) a prática de criar instruções claras e estruturadas para orientar a IA na geração de imagens.

Um prompt bem elaborado pode ser a diferença entre um resultado com uma imagem medíocre, ou um conteúdo que parece que você pagou caro pra um designer profissional desenvolver.

Temos uma matéria completa falando detalhes sobre engenharia de prompt, do básico a aspectos avançados.

Se quiser acessá-la, clique aqui.

3.1 Os Principais Elementos

Nossa meta é analisar a nossa criação de imagem com elementos que constituem QUALQUER imagem ou foto (real ou fictícia) que vemos na internet.

Os 5 principais elementos de acordo com a minha experiência prática, são:

O Objeto Principal: toda foto, toda imagem tem um elemento principal (que é o intuito do registro da imagem), seja ele um por do sol, um animal, um personagem, ou qualquer elemento que possamos categorizar.

O Estilo: as imagens podem ter estilos diferentes, podem ser realísticas, vintage, no estilo de um desenho animado, podem parecer até mesmo com um determinado estilo de um pintor (ou obra de arte).

A atmosfera: toda imagem vai ter uma atmosfera, um ambiente, como a noite, ou no espaço sideral, ou em um jardim. Pense nisso como o pano de fundo da sua imagem.

A ação: nas fotos, geralmente existe uma ação por parte do objeto principal (falado anteriormente). As pessoas estão sorrindo ou tristes? O gatinho está brincando ou olhando para a câmera? Um barco está em movimento? Pense na dinâmica da sua imagem.

Cores Dominantes: aqui, podemos solicitar a IA cores mais quentes, ou mais frias. Podemos solicitar texturas metálicas, cores vivas, ou ainda um tom de preto e branco.

3.2 Um Prompt Básico Para Você Usar Agora

Coletando os elementos da lógica acima, você pode copiar e colar o prompt básico abaixo, simplesmente alterando os campos dos elementos com os quais você quer desenvolver o seu conteúdo.

Este prompt está utilizando uma técnica determinada Markdown, que é uma boa prática na engenharia de prompts (falamos mais sobre isto na matéria específica sobre EP).

# Prompt Simplificado para Geração de Imagem

1. **Objeto/Cena principal:** [Descrição breve]
2. **Estilo:** [Estilo artístico ou fotográfico]
3. **Atmosfera:** [Iluminação e humor geral]
4. **Cores dominantes:** [Paleta de cores principais]
5. **Ação/Contexto:** [O que está acontecendo na imagem]

Você vai conferir aqui um exemplo prático com esse prompt, segue comigo!

3.3 Iteração: Testar e Ajustar é Necessário

Iteração é um processo de repetição (sempre que necessário) que visa otimizar a sua solicitação a IA (prompt) de forma a ir cada vez mais melhorando a imagem de saída, isto é, atingindo o seu objetivo inicial.

Apesar de estarmos em 2024, e a capacidade de geração de imagem dos modelos já ter melhorado significativamente, é comum termos que ajustar os comandos ao longo do desenvolvimento.

Então tenha isto em mente.

Agora vamos pra prática!

Vamos testar a geração de uma imagem com um comando qualquer, e comparar com a utilização do prompt básico que fornecemos no tópico anterior.

4. Criando a Nossa Imagem na Prática

Vamos supor aqui que eu quero uma imagem que chame atenção, que quebre padrões, para fazer um anúncio de captação para a minha empresa de marketing digital.

Logo, eu quero uma imagem feita por IA, que seja de um gato, com um traje de astronauta acenando para a câmera, no espaço sideral.

Vamos simplesmente copiar e colar isto.

O nosso resultado é a imagem abaixo:

Imagem com o contexto mínimo. DALL E 3 via ChatGPT.

Pode ser que essa imagem já cumpra com a nossa expectativa, pode ser que não.

A nível de teste, vamos agora implementar esse mesmo contexto, mas agora utilizando o modelo de prompt básico que estamos sugerindo.

Abaixo, o mesmo prompt com o preenchimento dentro do mesmo contexto e objetivo da imagem.

# Prompt Projeto de marketing: um gatinho chamando muita atenção. 

Temos uma empresa que presta serviços de marketing digital e queremos a imagem inusitada de um gato, para provocarmos o famoso "stop scrolling - parar a rolagem" dos nossos potenciais clientes nas redes sociais. Abaixo a descrição técnica da imagem (contexto no prompt).

1. **Objeto/Cena principal:** [Um gato com traje espacial olhando para a câmera]
2. **Estilo:** [realístico 4k - 1080p]
3. **Atmosfera:** [um cenário rico interplanetário]
4. **Cores dominantes:** [cores em contraste no estilo de renderização profissional]
5. **Ação/Contexto:** [o gato está levitando com o traje espacial e acena para a foto. atrás dele uma nave espacial com alienígenas se desloca (toque especial)]

O nosso novo resultado é a imagem abaixo:

Imagem com a recomendação de prompt básico. DALL E 3 via ChatGPT.

E aí? O que achou?

Essa imagem ficou melhor? Pior?

Sem dúvida, a nossa imagem está com um conteúdo mais rico.

4.1 Criando uma Nova Imagem com IA Anexando Arquivos

Mesmo na versão gratuita, o ChatGPT vai possibilitar que você anexe uma imagem, clicando no ícone de um Clips ao lado esquerdo da barra de digitação.

Ali, você pode subir uma imagem do seu interesse e solicitar uma nova versão, ou ainda solicitar com um novo prompt, um ajuste específico.

Os exemplos são praticamente infinitos e dependem da sua criatividade.

A título de teste, vamos solicitar uma nova imagem, a partir de uma das imagens anteriores geradas.

Print retirado pelo autor, solicitando uma variação por anexo ago2024.

Como variação, utilizando a versão gratuita do ChatGPT, tivemos o seguinte resultado:

Variação de Imagem Anexando Arquivo no ChatGPT. DALL E 3 via ChatGPT.

Não vamos entrar no mérito se a imagem realmente ficou melhor ou pior.

Vamos tecnicamente analisar que, os principais aspectos relacionados ao prompt que originou a imagem foram mantidos, como: o objeto/elemento (gato), a atmosfera (espaço com cenário interplanetário) e a ação (o gato olhando a acenando para a foto).

Neste aspecto a nossa variação foi realizada com sucesso.

5. Problemas e Limitações na Criação de Imagens com IA

A geração de imagens com IA, apesar de seus avanços impressionantes, ainda apresenta desafios e limitações que podem levar a resultados inesperados ou indesejados.

Algumas das principais limitações são:

Dificuldade com Conceitos Abstratos: As IAs podem lutar para representar ideias abstratas ou conceitos complexos de maneira precisa.

Viés e Representação: Os modelos podem refletir vieses presentes nos dados de treinamento, levando a representações tendenciosas ou estereotipadas.

Detalhes Específicos: Pode ser desafiador para a IA gerar detalhes muito específicos ou manter consistência em elementos como texto ou números em imagens.

5.1 Por que o Mesmo Prompt Gera Imagens Diferentes?

Se você simplesmente copiar o prompt que utilizamos, e colar no mesmo modelo do ChatGPT que utiliza (pelo menos por enquanto) o DALL E 3 para geração, você terá um resultado diferente!

Mas por quais motivos o mesmo prompt (solicitação) com o mesmo modelo gera resultados distintos?

A geração de imagens com IA é um processo que envolve elementos de aleatoriedade, mesmo quando o mesmo prompt é utilizado repetidamente.

Isso se deve a diversos fatores técnicos.

Alguns destes são:

Redes Neurais e Pesos: Modelos de IA utilizam redes neurais complexas com bilhões de parâmetros (“pesos”) que são ajustados durante o treinamento. Pequenas variações nesses pesos podem levar a resultados diferentes, mesmo com o mesmo input.

Processos Estocásticos: Muitos algoritmos de geração de imagens utilizam processos estocásticos (aleatórios) em alguma etapa, como na inicialização dos “pesos” da rede ou na amostragem de pixels durante a geração da imagem. Essa aleatoriedade introduz variabilidade nos resultados.

Latent Space: IAs geralmente trabalham com um “espaço latente”, uma representação matemática abstrata dos dados de treinamento. Ao gerar uma imagem a partir de um prompt, o modelo navega nesse espaço latente, e pequenas variações no ponto de partida ou na trajetória podem levar a resultados diferentes.

Seed: Muitos modelos permitem a definição de uma “seed” (semente), um valor numérico que influencia o processo de geração de imagens. Mesmo com o mesmo prompt, diferentes seeds levarão a resultados distintos.

Para os criadores de conteúdo e artistas, essa unicidade oferece uma ferramenta poderosa para a exploração criativa.

Cada geração pode ser vista como uma nova interpretação do prompt, fornecendo inspiração e possibilidades inesperadas.

No entanto, para aplicações que requerem consistência e reprodutibilidade exata, essa característica pode ser um desafio.

Nesses casos, algumas plataformas oferecem a opção de salvar a “semente” (seed) usada para uma geração específica, permitindo reproduzir a mesma imagem posteriormente.

Outras Opções de Uso Gratuito para Criar Imagens com IA

É claro que nós não temos só o ChatGPT da OpenAI no mercado.

Existem opções que permitem que você crie imagens em um ambiente web muito similar, como o Leonardo AI e o Night Café.

E também existem opções que são acessadas por meio dos servidores Discord, como o MidJourney e BlueWillow.

Estes modelos oferecem créditos para que você teste gratuitamente a qualidade do desenvolvimento de imagens.

Então se aventure, nada é melhor do que a execução para que você fique cada vez melhor em gerar imagens com IA.

Conclusões

Criar imagens com o DALL-E 3 no ChatGPT é uma experiência que mistura criatividade e precisão.

Ao entender como construir prompts detalhados e específicos, você pode obter resultados que superam suas expectativas.

Experimente, refine e aproveite, seja você um artista, designer ou apenas alguém querendo explorar novas ideias visuais com tecnologia de ponta das IAs.

Se cadastre abaixo e receba diretamente no seu e-mail novos tutoriais, notícias e conteúdo sobre inteligência artificial, gratuitamente e sem propagandas.

Referências

LearnPrompt, DALL E 3 e MidJourney,

Sair da versão mobile