Inteligência Artificial

DALL-E reacende discussão sobre a automação da criatividade

A OpenAI divulgou a DALL-E, uma rede neural capaz de gerar imagens inéditas usando textos como entrada. Com essa invenção será que estamos a romper mais uma barreira e a entrar na era da automação da criatividade?

No final de 2020 a OpenAI chocou mais uma vez o mundo com o seu novo algoritmo: DALL-E (veja aqui). A organização já havia gerado um grande buzz ao lançar a GPT-3, uma rede neural de Processamento de Linguagem Natural, com a qual é possível gerar textos complexos a partir de poucas palavras como entrada. Um exemplo que rodou o mundo foi o texto que dizia que unicórnios foram encontrados por um investigador boliviano (ver aqui). Naquele momento a organização decidiu não divulgar o código-fonte da sua invenção com receio que fosse usada para criar e divulgar fake news a uma velocidade nunca antes vista.

Agora a OpenAI divulga uma tecnologia capaz de gerar imagens, muito complexas, diga-se de passagem, a partir de apenas texto. Com poucas palavras escritas, como comandos para a solução, é possível receber resultados inusitados como uma poltrona em formato de abacate e um caracol feito de uma harpa. Resumindo e simplificando o processo, essa nova tecnologia baseada em redes neurais foi treinada com mil milhões de exemplos de pares de textos e imagens até que fosse possível criar uma conexão semântica entre elas.  Assim, a rede neural é capaz de gerar imagens inéditas tendo como ponto de partida descrições inusitadas.

O nome da nova solução da OpenAI, DALL-E, é a soma dos nomes do pintor Salvador Dalí e do simpático robô da Pixar, Wall-E. Nenhum outro nome expressaria tão bem o surrealismo cibernético dos resultados dessa inteligência artificial. Ao que parece, os caminhos da IA e criatividade estão a ficar cada vez mais próximos.

Não que a discussão de criatividade e inteligência artificial seja nova. Em 2015, o site DeepArt.io (veja aqui) foi lançado criando a possibilidade de transformar as suas selfies numa pintura do Picasso. Nessa ocasião começamos a discutir sobre propriedade intelectual e se esses algoritmos estariam de facto a expressar alguma criatividade. Agora, ao que tudo indica, estamos a dar um passo além.

Codificação da criatividade

Por muito tempo utilizamos o argumento que a Inteligência Artificial ameaçava principalmente trabalhos repetitivos e previsíveis. Será que nesse momento estamos a ver a criação e conexão de tecnologias que podem tirar o sono também de profissionais da criatividade?

Murilo Gun, empreendedor e palestrante, advoga que a palavra criatividade talvez tenha um significado muito pesado e que nós deveríamos rebatizá-la de “combinatividadade”. Neologismos à parte, é inegável que uma parte considerável da criatividade seja chocar ideias e inputs diferentes a fim de gerar algo completamente novo. Esse parece ser um ponto de partida interessante para pensar como a criatividade pode ser codificada, automatizada e amplificada por algoritmos de inteligência artificial.

Plataformas de anúncios em redes sociais estão a desenvolver cada vez mais ferramentas para que o processo criativo de geração de anúncios possa ser cada vez mais automatizado. Um exemplo são os anúncios dinâmicos. O leitor, como anunciante, cria uma biblioteca de vídeos, imagens, chamadas para ação e títulos e a plataforma é responsável por compor todas essas camadas para criar anúncios que sejam otimizados para a conversão com cada tipo de público.

Neste exemplo dos anúncios dinâmicos ainda temos uma parcela grande de inputs humanos para o algoritmo, mas o processo de decisão do que é melhor para converter vendas e criar o anúncio que vai ser visto pelo público passa a ser artificial.

No caso da DALL-E, criar algo novo passa a ser uma tarefa completamente realizada pela inteligência artificial. Nas ilustrações acima podemos ver como esse algoritmo interpreta um comando e é capaz de gerar uma imagem que traz consigo vários aspectos do que consideramos um resultado criativo. É possível imaginar o Salvador Dalí desenhando algumas dessas poltronas em forma de abacate.

Se somarmos o DALL-E ao GPT-3, e a sua capacidade de gerar textos, e as tecnologias de big data, como recolha e interpretação de grandes volumes de dados, podemos ter uma combinação incrível das suas capacidades. Podemos captar informações e gerar insights de utilizadores em redes sociais e utilizá-los para gerar textos e imagens que poderão ser usados para criar anúncios com personalização perfeita para as suas necessidades.

Isso pode parecer um tanto distante nesse momento, mas podemos estar a caminhar para a codificação e automatização de várias atividades criativas ao longo do tempo. Não seria exagero dizer que o que nos separa desse cenário seja um pouco de tempo e aprimoramento das tecnologias existentes.

Nesse momento resta-nos aguardar e imaginar o que poderemos fazer quando estas tecnologias forem libertadas para a utilização do grande público. O exemplo de anúncios dinâmicos é apenas uma forma de utilização, mas existem muitas outras possíveis que ainda serão desenvolvidas com o tempo.

Ao que parece, estamos cada vez mais próximos de encontrar o algoritmo da criatividade.

Artigo de Lucas Santana, Autor – MIT Technology Review Brasil

Nossos tópicos