A Inteligência Artificial está travando uma guerra entre as empresas que estão correndo para ganhar destaque. Elas fazem, basicamente a mesma função, como produzir imagens automáticas a partir de uma descrição simples. Muitas empresas estão “treinando” o algoritmo para que consigam trazer uma imagem mais próxima daquilo que se pede, mas há muita coisa para melhorar ainda.
No Google, cada vez que fazemos uma busca, o algoritmo confere se o usuário clicou e permaneceu naquele link apresentado por algum tempo. Assim, é possível dizer se a página tem ou não as informações que foram solicitadas no buscador. Isso melhora, automaticamente, o ranqueamento e a qualidade das respostas ao longo do tempo.
Quando você solicita, por meio de um prompt, por exemplo, a criação de uma imagem, não é possível saber se você gostou ou não do resultado. O uso da plataforma que irá determinar se você está gostando ou não dos resultados. É uma resposta mais genérica e menos direta sobre a plataforma. Você pode utilizar uma imagem produzida para inúmeros fins e a IA não saberá se você a usou ou como usou aquela imagem gerada. Por isso, são tão diversas as respostas dos algoritmos quando solicitamos a criação de uma imagem por Inteligência Artificial. Ainda não temos a melhor plataforma para gerar imagens de um determinado tipo. Mas em pouco tempo teremos.
Escrevi uma solicitação para produção de uma imagem para três IAs diferentes e as respostas foram muito distintas.
O texto foi: generate art that shows a white man, black hair, glasses with black frames. He is sitting at an office desk in a high-rise building. Behind there is a window with large buildings. (gerar arte que mostre um homem branco, cabelo preto, óculos com armação preta. Ele está sentado em uma mesa de escritório em um prédio alto. Atrás há uma janela com grandes edifícios.)
O resultado apresentado pela IA da DiffusionBee (imagem abaixo) mostrou uma imagem simples como um desenho em preto e branco. Dependendo do propósito é um desenho muito bonito, mas sem muitos detalhes. Vale ressaltar que por conta da dinâmica da IA, é muito difícil seguir uma identidade visual uniforme para várias peças. Caso você precise de uma série de imagens, é importante pedir todas de uma única vez.
Já o Photo_CreateE, o gerador de imagens da POE apresentou um desenho mais próximo do que foi solicitado em um modelo de imagem mais realista, imitando um desenho em quadrinhos moderno. Observem que as mãos estão com os contornos estranhos. A IA tem muita dificuldade (ainda) para desenhar detalhes. Mas o resultado do Photo_CreateE (abaixo) é bem superior e, com alguns ajustes, pode melhorar bastante.
Outra ferramenta que testamos com o mesmo prompt foi a Criayon. Ela trouxe 9 imagens variadas que não obedecem muito o que foi solicitado. No prompt foi solicitado um homem com cabelo preto, mas nas imagens há vários desenhos de homens sem cabelo. Esse gerador de imagem também tem um ar mais futurista e os detalhes das imagens são também ruins. Outro ponto importante é a resolução baixa que a ferramenta entrega (abaixo).
O melhor resultado está na empresa que mais está investindo em IA entre as bigtechs, o Bing da Microsoft. A ferramenta não apenas trouxe o melhor resultado, mas também é mais fácil de usar e mais rápida nas respostas. A ferramenta mostra os históricos e tem integração com ChatGPT, entre outras funcionalidades. Vejam os dois resultados apresentados pelo Bing.
Quais imagens você mais gostou? Compartilhe sua opinião sobre a IA. Acompanhe o canal do Whatsapp para receber informações sobre o tema. Acesse: https://whatsapp.com/channel/0029VaGbj2o1NCrU13vJJZ1q