ChatGPT Operator e Agentes que Automatizam o Navegador

O ChatGPT Operator foi a aposta da OpenAI em “agentes” capazes de usar um navegador como uma pessoa, clicando, digitando e rolando a página para concluir tarefas. Desde 2025, a própria OpenAI passou a incorporar essa lógica no recurso chamado ChatGPT agent, com foco em automação com supervisão do usuário.

O que é o ChatGPT Operator

O Operator foi apresentado pela OpenAI em 23 de janeiro de 2025 como um agente que executa tarefas na web usando um navegador próprio. Na prática, ele observa a página por meio de imagens e interage com a interface, com ações como clicar, digitar e rolar, em vez de depender apenas de integrações via API.

Segundo a OpenAI, o Operator é baseado em um modelo chamado Computer Using Agent, treinado para lidar com elementos de interface, como botões, menus e campos de texto. A proposta é reduzir o tempo gasto com tarefas repetitivas de navegador, mantendo a possibilidade de o usuário assumir o controle quando necessário.

Para detalhes oficiais, a referência principal é o anúncio da OpenAI em Introducing Operator.

O que dá para automatizar na prática

O Operator foi pensado para tarefas que exigem navegação em sites comuns, com passos previsíveis, mas trabalhosos. Exemplos citados pela OpenAI incluem preencher formulários e fazer compras, como pedir supermercado, além de outras rotinas de navegação.

Exemplo prático: em vez de abrir várias abas para organizar uma viagem, o usuário descreve o objetivo, por exemplo “encontre um hotel com café da manhã e cancelamento grátis para estas datas”, e o agente percorre o fluxo no navegador, listando opções e pedindo confirmação antes de etapas sensíveis.

  • Bom encaixe: tarefas repetitivas, com critérios claros, em sites que já funcionam bem no modo manual.
  • Mau encaixe: fluxos com muita ambiguidade, páginas instáveis, ou situações em que qualquer erro custa caro, como decisões financeiras ou compras complexas.

Uma característica destacada em coberturas do lançamento é a visualização do navegador do agente em uma janela separada, com explicações do que está sendo feito, o que ajuda a auditar passos e interromper quando algo sai do esperado.

Disponibilidade, planos e o que mudou desde o lançamento

No lançamento, em 23 de janeiro de 2025, a OpenAI liberou o Operator como “research preview” e começou com acesso para assinantes Pro nos EUA, com a intenção declarada de expandir depois. Na sequência, a OpenAI ampliou o rollout para outros países, incluindo o Brasil, ainda mantendo a exigência do plano Pro em parte desse período.

Outra mudança importante veio em 17 de julho de 2025, quando a OpenAI anunciou o ChatGPT agent, afirmando que a funcionalidade central do Operator foi integrada ao agente dentro do ChatGPT e que a experiência separada em operator.chatgpt.com seria descontinuada nas semanas seguintes. Na mesma atualização, a OpenAI registrou disponibilidade do ChatGPT agent para Pro, Plus e Team, e em 8 de agosto de 2025 estendeu para Enterprise e Edu.

  • Operador no início: research preview, com liberação gradual e foco em aprendizado com uso real. Fonte oficial.
  • Evolução do produto: integração no ChatGPT agent e aviso de descontinuação do fluxo “standalone”. Release notes do ChatGPT agent.
  • Preço citado no lançamento: o plano ChatGPT Pro foi associado ao valor de US$ 200 por mês em coberturas do período. TechCrunch.

Impacto, riscos e como usar com segurança

Automatizar navegador é poderoso justamente porque mexe onde as coisas acontecem, em páginas reais, com dados reais. Por isso, o lado “produto” e o lado “segurança” andam juntos: além de erros comuns de automação, aparecem riscos específicos como instruções maliciosas inseridas em páginas, o chamado prompt injection, que podem tentar desviar o agente do objetivo original.

A OpenAI descreveu camadas de controle, incluindo o agente pedir que o usuário assuma em etapas críticas, como login, pagamentos e CAPTCHAs. Em material técnico, a empresa também discute avaliações de risco e mitigação para reduzir abusos e ações indesejadas, além de taxas de recusa em tarefas potencialmente nocivas. Para uma leitura mais detalhada, vale a Operator System Card.

  • Regra de ouro: qualquer etapa com senha, dados bancários ou confirmação final de compra deve ser revisada manualmente.
  • Trava de confiança: se o site mudar de layout, aparecer algo inesperado, ou o agente “parecer confuso”, parar, voltar um passo e retomar com instruções mais específicas.
  • Mini modelo para decidir: Tempo, Confiança, Custo. Se economiza tempo recorrente, o risco do erro é baixo e o custo do plano faz sentido, a automação tende a valer. Se um desses três quebra, melhor manter humano no loop.

Como regra prática de decisão, o melhor ponto de partida é automatizar apenas tarefas repetitivas e reversíveis, e deixar decisões finais e pagamentos sempre sob confirmação do usuário.


Publicado

em

por