"Trend do anime” está sobrecarregando a estrutura dos computadores da OpenAI
Viralizou nas redes sociais nos últimos dias uma nova trend na qual as pessoas vêm compartilhando suas fotografias “redesenhadas” em estilo de anime. Produzidas pelo modelo de inteligência artificial (IA) GPT-4o, da OpenAI, as imagens são geradas baseadas nas produções audiovisuais do Studio Ghibli, conhecido por filmes como Meu Amigo Totoro (1988), A Viagem de Chihiro (2001) e O Menino e a Garça (2023).
O hype controverso levou o ChatGPT a apresentar um crescimento como nunca antes – cerca de um milhão de novos usuários a cada hora, segundo Sam Altman, CEO da OpenAI, que controla o chatbot, em publicação no X (antigo Twitter). No entanto, esse fenômeno teve uma outra consequência inesperada: o sistema da empresa apresentou dificuldade para acompanhar o volume dos comandos para criar novas imagens.
Com isso, a OpenAI precisou aplicar de maneira preventiva limites temporários nos pedidos de geração de imagem no chat e exigir tempos de processamento mais longos, a fim de evitar que as Unidades de Processamento Gráfico (GPUs) por trás do modelo de IA atingissem o seu máximo e pifassem. Mas o que explica essa ocorrência anormal?
Não é a primeira vez que uma trend envolvendo a geração de imagens em um estilo inspirado no cinema e nas séries acontece. Há alguns meses, por exemplo, a “vítima” foi o estúdio Pixar, da Disney. Na ocasião, milhares de “desenhos” que lembravam os traços de Up: Altas Aventuras (2009), Divertida Mente (2015), Luca (2021) e tantos outros circularam nas redes sociais.
Desta vez, porém, o estilo Ghibli mostrou-se um empecilho extra por sua riqueza de detalhes. A produtora japonesa tem um traço característico, feito à mão por artistas profissionais, que se aproveita da nostalgia, da profundidade emocional e do onirismo para criar personagens e cenários expressivos e icônicos.
Para se ter uma ideia de quão complexo é esse processo criativo, vale lembrar que a cena acima, presente no filme Vidas ao Vento (2013) exigiu um cuidadoso trabalho de um ano e três meses pelo animador Eiji Yamamori. Tentar replicar isso exige das máquinas um processamento intenso.
Ao contrário do processamento de imagens tradicional, em que os modelos de IA precisam apenas analisar conjuntos de dados, para aplicar técnicas artísticas complexas específicas, torna-se necessário renderizar milhares de pequenos detalhes pixel por pixel. Uma única solicitação pode acionar bilhões de cálculos.
Diferentemente das Unidades Centrais de Processamento (CPUs), que lidam com tarefas gerais de computação, as GPUs das aplicações de IA são projetadas para realizar processamentos paralelos e cálculos simultâneos. Na prática, isso exige muita energia.
Como forma de amenizar o problema, o site Interesting Engineering destaca que a OpenAI anunciou limites para seus usuários de nível gratuito, reduzindo a possibilidade de geração de imagens para três por dia. Embora a mudança possa frustrar alguns, ela é justificada como uma etapa necessária para manter as operações funcionando até a empresa conseguir otimizar sua infraestrutura.