Scarlett Johansson sinalizou possível ação legal após dizer que recusou licenciar sua voz e, mesmo assim, viu uma voz de demonstração do ChatGPT ser percebida como parecida com a dela. A OpenAI, por sua vez, colocou a voz “Sky” em pausa e publicou uma explicação sobre o processo de seleção e gravação das vozes.
Linha do tempo do convite ao impasse
O ponto central não é só “parecer”, é a combinação de contexto, timing e expectativa pública. Segundo a OpenAI, Sam Altman conversou com a equipe de Johansson em 11 de setembro de 2023 sobre ela virar uma possível sexta voz do produto, e ela recusou via agente cerca de uma semana depois. openai.com
A OpenAI afirma que as cinco vozes iniciais, incluindo “Sky”, entraram no ChatGPT em 25 de setembro de 2023. Já em 10 de maio de 2024, Altman voltou a procurar o time da atriz para ela reconsiderar, pouco antes da apresentação do GPT‑4o em 13 de maio de 2024. openai.com
Em maio de 2024, após a demonstração pública e a repercussão, Johansson disse ter ficado surpresa com a similaridade percebida e acionou advogados. A OpenAI informou que estava trabalhando para pausar “Sky” depois das dúvidas levantadas. apnews.com
O efeito “Her” e a força da associação cultural
Muita gente ligou a voz “Sky” ao filme Ela (2013), no qual Johansson dublou uma assistente de IA. A comparação ganhou tração porque, na prática, o público não avalia só timbre, também avalia “personalidade” vocal, cadência e a referência cultural mais óbvia. pt.wikipedia.org
O caso ficou ainda mais sensível porque Altman publicou “her” no X no dia do anúncio do GPT‑4o, algo interpretado como referência direta ao filme. Esse detalhe não prova intenção por si só, mas amplifica a percepção de que a semelhança buscada era, no mínimo, conveniente do ponto de vista de marketing. cnbc.com
Na prática, quando uma tecnologia toca em identidade, a régua do público é simples: se “soa como alguém” e o contexto aponta para essa pessoa, nasce o risco reputacional, mesmo que exista um dublador real por trás.
O que a OpenAI disse sobre as vozes
A OpenAI publicou um texto detalhando como escolheu as vozes e afirmou que “Sky” pertence a uma atriz de voz diferente, usando sua própria voz natural. A empresa também contextualizou datas, seleção interna e gravações presenciais para formar as opções do produto. openai.com
Segundo a OpenAI, o processo envolveu uma equipe de casting, triagem e escolha final das cinco vozes que viriam a se tornar Breeze, Cove, Ember, Juniper e Sky, com gravações em São Francisco e lançamento em setembro de 2023. openai.com
Em paralelo, veículos noticiaram que a empresa colocou “Sky” em pausa após a reação pública. Altman também declarou que a voz não foi “planejada” para soar como Johansson e que o elenco do dublador teria sido escolhido antes do contato com a atriz. apnews.com
Leis, ética e a disputa por “direito à voz”
O impasse expõe uma zona cinzenta: em muitos lugares, a proteção jurídica da voz fica espalhada entre direitos de imagem, direito de publicidade, concorrência desleal e, às vezes, contratos, e não como uma regra única feita para IA. Nos EUA, isso tende a variar por estado, o que incentiva propostas federais para padronização. congress.gov
Dois marcos relevantes citados com frequência nesse debate são:
- ELVIS Act, lei do Tennessee sancionada em 21 de março de 2024, voltada a proteger voz e imagem contra usos indevidos, incluindo cenários com IA. Leia um resumo. en.wikipedia.org
- NO FAKES Act, proposta federal apresentada em 9 de abril de 2025, com foco em direitos sobre voz e semelhança visual e em regras para “réplicas digitais”. Veja o texto no Congress.gov. congress.gov
Esse debate também acontece no pano de fundo de outras pressões judiciais sobre IA generativa, em especial ações de direitos autorais contra a OpenAI por uso de livros e notícias no treinamento de modelos. Exemplos incluem o processo de autores liderados pela Authors Guild em 20 de setembro de 2023 e a ação do The New York Times contra OpenAI e Microsoft em 27 de dezembro de 2023. apnews.com
Para o público brasileiro, vale a leitura como tendência: mesmo com diferenças entre sistemas jurídicos, a discussão sobre consentimento, atribuição e limites de imitação tende a aparecer aqui também, especialmente em publicidade, dublagem e atendimento automatizado.
Como evitar um caso parecido em produtos e campanhas
A lição operacional é que “não ser a voz da pessoa” pode não bastar se o resultado ficar identificável, e se o briefing estiver ancorado em uma referência famosa. A melhor prevenção mistura política interna, testes e documentação.
Exemplo prático para uma empresa no Brasil
Imagine um banco criando uma voz para atendimento no WhatsApp e no app. Em vez de pedir ao estúdio “algo no estilo da Scarlett”, o caminho mais seguro é contratar um dublador com personagem vocal próprio, assinar um termo de uso claro, gravar um conjunto de frases padrão, e rodar um teste cego com pessoas fora do projeto para verificar se alguém associa a voz a celebridades específicas.
Regra de decisão simples
- Se a referência inicial do projeto for uma pessoa real, interromper o briefing e substituir por critérios técnicos, por exemplo “tom calmo”, “fala rápida”, “sotaque neutro”, “energia alta”.
- Se 2 ou mais avaliadores independentes associarem a voz a um nome específico, refazer a voz ou mudar a direção, antes de lançar.
Mini modelo para entender o mercado
Pense na tensão Tecnologia, Talento, Tempo: a tecnologia de voz evolui rápido, o talento, atores e dubladores, quer proteção e remuneração previsível, e o tempo da regulação é mais lento. Quando esses três ritmos se desencontram, o custo aparece primeiro como crise de confiança, e só depois vira regra clara.
Para quem desenvolve produto, a implicação é direta: voz é interface, e interface é identidade. Tratar voz como “apenas um asset” costuma sair caro.
