Marcas d’água em imagens do ChatGPT e falhas

As “marcas d’água” do ChatGPT em imagens não são um carimbo visível, na prática elas aparecem como metadados de proveniência no padrão C2PA. O problema é que esse tipo de sinal se perde com facilidade quando a imagem é reenviada, reexportada ou processada por plataformas, o que limita o valor da checagem no dia a dia.

O que a “marca d’água” realmente é

Quando o assunto vira “remover marca d’água do ChatGPT”, geralmente existe uma confusão importante. No caso das imagens geradas com DALL, E 3 dentro do ChatGPT, a OpenAI passou a incluir metadados de proveniência baseados no padrão C2PA, que funcionam como um histórico técnico, dizendo que aquela mídia foi criada por uma ferramenta específica.

Isso se conecta ao ecossistema de Content Credentials, que é a forma mais comum de “ler” esses dados quando eles continuam presentes no arquivo. O objetivo é simples, dar uma pista verificável sobre a origem, especialmente em um cenário de deepfakes e manipulações cada vez mais baratas.

Por que o sinal desaparece tão fácil

O ponto central é que metadados são frágeis no “mundo real” da internet. Redes sociais costumam recomprimir imagens, alguns apps removem informações ao salvar, e fluxos comuns de compartilhamento podem descartar esses campos, mesmo sem intenção de enganar.

A própria OpenAI reconhece que metadados de C2PA não são solução definitiva, já que podem ser removidos acidentalmente ou de propósito, e que a ausência do sinal não prova nada, nem para um lado nem para o outro. Isso é um limite estrutural da abordagem baseada somente em metadados.

Essa fragilidade foi popularizada por reportagens como a da Forbes, que chamou atenção para o quão trivial é perder esse “rastro” em cenários cotidianos, veja The Ridiculously Easy Way To Remove ChatGPT’s Image Watermarks.

Como verificar origem sem cair em armadilhas

O uso correto desses sinais é tratá-los como indício, não como veredito. Quando o metadado está presente, ele ajuda, quando não está, não dá para concluir automaticamente que a imagem é “limpa” ou “humana”.

Exemplo prático que acontece no Brasil

Imagine uma imagem viral no WhatsApp dizendo ser “foto de última hora” de um evento, um desastre natural ou um político em uma situação comprometedora. A checagem pode seguir um fluxo simples, primeiro verificar se há credenciais, depois buscar contexto e por fim procurar confirmações independentes.

Regra de decisão rápida

Se a imagem tem credencial, use isso para rastrear a origem e entender a cadeia de edições. Se não tem, trate como não verificada e passe para checagens de contexto, como data, local, fonte primária e cobertura por veículos confiáveis.

Ferramentas úteis

Para verificar quando o arquivo ainda mantém os dados, uma opção é o serviço oficial do ecossistema de Content Credentials em Content Credentials, que aponta para a ferramenta de verificação. Para entender a base técnica, vale consultar o padrão C2PA e a explicação da própria OpenAI sobre a implementação em Understanding the source of what we see and hear online.

O que isso diz sobre o mercado de autenticidade

Dá para resumir o momento do setor em um mini modelo de três forças, Sinal é o que o arquivo carrega, como C2PA, Fricção é o quanto esse sinal sobrevive ao caminho real de compartilhamento, e Alcance é quantas plataformas preservam ou exibem essa informação de forma clara.

Hoje, o gargalo é a fricção, o sinal até existe, mas a “cadeia de custódia” da mídia se quebra fácil no caminho. Por isso o mercado tende a combinar várias camadas, metadados de proveniência, padrões abertos, políticas de plataforma e, em paralelo, técnicas mais resistentes a alterações.

Publicado

fevereiro 9, 2024

Notícias

por

admin

Tags:

Desinformação, IA generativa, Segurança digital