Scarlett Johansson pressiona OpenAI por voz similar

Scarlett Johansson sinalizou possível ação legal após dizer que recusou licenciar sua voz e, mesmo assim, viu uma voz de demonstração do ChatGPT ser percebida como parecida com a dela. A OpenAI, por sua vez, colocou a voz “Sky” em pausa e publicou uma explicação sobre o processo de seleção e gravação das vozes.

Linha do tempo do convite ao impasse

O ponto central não é só “parecer”, é a combinação de contexto, timing e expectativa pública. Segundo a OpenAI, Sam Altman conversou com a equipe de Johansson em 11 de setembro de 2023 sobre ela virar uma possível sexta voz do produto, e ela recusou via agente cerca de uma semana depois. openai.com

A OpenAI afirma que as cinco vozes iniciais, incluindo “Sky”, entraram no ChatGPT em 25 de setembro de 2023. Já em 10 de maio de 2024, Altman voltou a procurar o time da atriz para ela reconsiderar, pouco antes da apresentação do GPT‑4o em 13 de maio de 2024. openai.com

Em maio de 2024, após a demonstração pública e a repercussão, Johansson disse ter ficado surpresa com a similaridade percebida e acionou advogados. A OpenAI informou que estava trabalhando para pausar “Sky” depois das dúvidas levantadas. apnews.com

O efeito “Her” e a força da associação cultural

Muita gente ligou a voz “Sky” ao filme Ela (2013), no qual Johansson dublou uma assistente de IA. A comparação ganhou tração porque, na prática, o público não avalia só timbre, também avalia “personalidade” vocal, cadência e a referência cultural mais óbvia. pt.wikipedia.org

O caso ficou ainda mais sensível porque Altman publicou “her” no X no dia do anúncio do GPT‑4o, algo interpretado como referência direta ao filme. Esse detalhe não prova intenção por si só, mas amplifica a percepção de que a semelhança buscada era, no mínimo, conveniente do ponto de vista de marketing. cnbc.com

Na prática, quando uma tecnologia toca em identidade, a régua do público é simples: se “soa como alguém” e o contexto aponta para essa pessoa, nasce o risco reputacional, mesmo que exista um dublador real por trás.

O que a OpenAI disse sobre as vozes

A OpenAI publicou um texto detalhando como escolheu as vozes e afirmou que “Sky” pertence a uma atriz de voz diferente, usando sua própria voz natural. A empresa também contextualizou datas, seleção interna e gravações presenciais para formar as opções do produto. openai.com

Segundo a OpenAI, o processo envolveu uma equipe de casting, triagem e escolha final das cinco vozes que viriam a se tornar Breeze, Cove, Ember, Juniper e Sky, com gravações em São Francisco e lançamento em setembro de 2023. openai.com

Em paralelo, veículos noticiaram que a empresa colocou “Sky” em pausa após a reação pública. Altman também declarou que a voz não foi “planejada” para soar como Johansson e que o elenco do dublador teria sido escolhido antes do contato com a atriz. apnews.com

Leis, ética e a disputa por “direito à voz”

O impasse expõe uma zona cinzenta: em muitos lugares, a proteção jurídica da voz fica espalhada entre direitos de imagem, direito de publicidade, concorrência desleal e, às vezes, contratos, e não como uma regra única feita para IA. Nos EUA, isso tende a variar por estado, o que incentiva propostas federais para padronização. congress.gov

Dois marcos relevantes citados com frequência nesse debate são:

ELVIS Act, lei do Tennessee sancionada em 21 de março de 2024, voltada a proteger voz e imagem contra usos indevidos, incluindo cenários com IA. Leia um resumo. en.wikipedia.org
NO FAKES Act, proposta federal apresentada em 9 de abril de 2025, com foco em direitos sobre voz e semelhança visual e em regras para “réplicas digitais”. Veja o texto no Congress.gov. congress.gov

Esse debate também acontece no pano de fundo de outras pressões judiciais sobre IA generativa, em especial ações de direitos autorais contra a OpenAI por uso de livros e notícias no treinamento de modelos. Exemplos incluem o processo de autores liderados pela Authors Guild em 20 de setembro de 2023 e a ação do The New York Times contra OpenAI e Microsoft em 27 de dezembro de 2023. apnews.com

Para o público brasileiro, vale a leitura como tendência: mesmo com diferenças entre sistemas jurídicos, a discussão sobre consentimento, atribuição e limites de imitação tende a aparecer aqui também, especialmente em publicidade, dublagem e atendimento automatizado.

Como evitar um caso parecido em produtos e campanhas

A lição operacional é que “não ser a voz da pessoa” pode não bastar se o resultado ficar identificável, e se o briefing estiver ancorado em uma referência famosa. A melhor prevenção mistura política interna, testes e documentação.

Exemplo prático para uma empresa no Brasil

Imagine um banco criando uma voz para atendimento no WhatsApp e no app. Em vez de pedir ao estúdio “algo no estilo da Scarlett”, o caminho mais seguro é contratar um dublador com personagem vocal próprio, assinar um termo de uso claro, gravar um conjunto de frases padrão, e rodar um teste cego com pessoas fora do projeto para verificar se alguém associa a voz a celebridades específicas.

Regra de decisão simples

Se a referência inicial do projeto for uma pessoa real, interromper o briefing e substituir por critérios técnicos, por exemplo “tom calmo”, “fala rápida”, “sotaque neutro”, “energia alta”.
Se 2 ou mais avaliadores independentes associarem a voz a um nome específico, refazer a voz ou mudar a direção, antes de lançar.

Mini modelo para entender o mercado

Pense na tensão Tecnologia, Talento, Tempo: a tecnologia de voz evolui rápido, o talento, atores e dubladores, quer proteção e remuneração previsível, e o tempo da regulação é mais lento. Quando esses três ritmos se desencontram, o custo aparece primeiro como crise de confiança, e só depois vira regra clara.

Para quem desenvolve produto, a implicação é direta: voz é interface, e interface é identidade. Tratar voz como “apenas um asset” costuma sair caro.