O tradutor, o intérprete e a ética
3 de abril de 2023
Os benefícios das mentorias para a indústria de tradução
2 de junho de 2023
O tradutor, o intérprete e a ética
3 de abril de 2023
Os benefícios das mentorias para a indústria de tradução
2 de junho de 2023

BLISS Talk

ChatGPT e o setor de Serviços Linguísticos: quando a poeira baixar

Por: Jorge Davidson

Em 30 de novembro de 2022, a OpenAI lançou o ChatGPT. A poeira que levantou ainda está no ar e pode ser vista nos milhares de artigos em jornais, revistas, em podcasts e nas redes sociais e, principalmente, nos mais de 100 milhões de usuários que conquistou em poucos meses. Mas, que mudanças veremos no setor de Serviços Linguísticos1 quando essa poeira baixar?

O ChatGPT despertou novamente o medo profundo dos seres humanos de serem substituídos pelas máquinas. Desta vez, o impacto foi sentido por criadores de conteúdo, auxiliares paralegais, agentes de viagens e profissionais da informática, entre muitos outros. Certamente, essa sensação não é nova para quem trabalha no setor de Serviços Linguísticos. Já vimos o filme do anúncio do fim da tradução humana desde a irrupção da tradução de máquina (ou automática) no mercado, no início do século XXI. Pelo que vimos até o momento, não parece provável que aconteça uma substituição catastrófica, mas é verdade que a tradução humana já foi substituída em certos tipos de conteúdo e para certas finalidades, em cenários onde a velocidade é mais importante que a qualidade e quando não seria possível usar a tradução humana devido ao volume, ao prazo e ao racional econômico, entre outros motivos. As inovações em matéria de tradução de máquina provocaram impactos importantes no setor, como a popularização da pós-edição e o surgimento de novas ferramentas e processos. Porém, em vez de uma substituição, o que vemos é a convivência de diversos modos de trabalhar, principalmente por meio de soluções híbridas que combinam o trabalho humano com o das máquinas. Os chamados Generative Large Language Models (LMM), um dos modelos de fundação do ChatGPT, parecem ser capazes de produzir um daqueles saltos de qualidade que já vimos com o lançamento da Neural Machine Translation (NMT) e a Adaptive Machine Translation, especialmente no que tange à naturalidade. Ou, pelo menos, é o que podemos ver no momento.  

Mesmo que o ChatGPT não tenha sido criado como uma ferramenta de tradução, um estudo publicado no blog Slator2 concluiu que ele concorre com sistemas de MT, como o Google Translate e o DeepL, em pares de línguas como inglês-alemão, mas fica em grande desvantagem em pares como inglês-romeno. Em textos especializados, tanto o DeepL quanto o GT superaram o ChatGPT, mas em materiais obtidos a partir de crowdsourcing de reconhecimento de fala, o ChatGPT superou ambos os sistemas. A explicação do primeiro resultado (pares de línguas) tem a ver diretamente com o material usado para o treinamento dos modelos. A escassez de dados limita a capacidade de modelagem da linguagem no caso do romeno. A explicação do segundo (tipo de conteúdo) é que tanto o DeepL quanto o GT são sistemas treinados para lidar com conteúdo de domínios específicos, como afirma Mihai Vlad,3 da Language Weaver. Vlad explica que os modelos de NMT “são modelos preditivos e otimizados para oferecer precisão” e, em contrapartida, os LLM não são capazes de oferecer isso em campos específicos, a menos que sofram adaptações cuja viabilidade ainda não está clara. Em poucas palavras, o potencial do LLM é grande, especialmente combinado com a NMT, o que abre interessantes possibilidades, mas ainda precisa ser trabalhado.

Do ponto de vista dos clientes, a poeira deve ter feito com que muitos pensassem que daqui para frente não precisariam mais pagar por serviços de tradução. Aqui cabe um mea culpa de certos atores do setor. Como diz Lynn Bowker4, a ideia de que a tradução de máquina é uma solução rápida, barata e boa foi vendida agressivamente, sem que muitos clientes reparassem que, na verdade, era pouco realista pensar que pudessem obter todas as três características. A mesma coisa parece estar acontecendo neste momento com o ChatGPT. Como bem sabemos, profissionais da tradução e empresas de tradução não se limitam a receber conteúdo na língua A e devolvê-lo na língua B. Esses prestadores de serviços linguísticos, ou LSPs (Language Service Providers), trabalham com a grande diversidade de formatos que os clientes exigem nos seus processos. Além disso, garantem a uniformidade dos textos, tanto em termos de estilo como de terminologia, o que permite manter a “voz da empresa”, isto é, a maneira particular de se comunicarem com seus usuários e clientes no mundo todo. Hoje, essa uniformidade é garantida pela combinação do uso de CAT Tools com ferramentas de tradução de máquina e com o trabalho de tradutores humanos. Então, a maneira de incorporar o ChatGPT no fluxo atual seria por meio de uma API para trabalhar dentro das CAT Tools, como acontece hoje com o restante dos sistemas de tradução de máquina. Isso já está sendo oferecido, mas não implica uma mudança importante na maneira de trabalhar, nem para os LSPs nem para profissionais da tradução independentes. Novos processos podem surgir no futuro, mas o fim da centralidade das CAT Tools não parece tão próximo assim. Em termos de tradução propriamente dita, o ChatGPT e a tradução de máquina são plataformas com várias coisas importantes em comum: não entendem o que estão traduzindo, não são criativas e tem dificuldades de lidar com a uniformidade e com assuntos para os quais não foram treinados. E o ChatGPT tem um problema adicional: por ser o que se chama de um sistema do tipo "caixa preta", ninguém sabe como chega aos resultados – no nosso caso, como traduz. Portanto, ajustar o ChatGPT não é uma tarefa fácil. Um problema adicional é que a naturalidade com a qual a plataforma elabora um texto pode ser bem enganosa para olhos não treinados. Um erro que não conseguiria passar por uma tradutora experiente ou um sistema de garantia de qualidade bem estruturado, pode passar com facilidade por uma pessoa do departamento de marketing ou um redator que não domina as línguas envolvidas. Nesse sentido, vale lembrar que não é a mesma coisa escrever de forma natural, com ótima legibilidade, que transmitir um conteúdo com precisão. A confidencialidade da informação é mais um problema: no chat com o ChatGPT, uma pessoa poderia estar alimentando o sistema com informações confidenciais, seja um relatório financeiro, um contrato ou informações pessoais. Outro aspecto a ser considerado é que usar Generative LLM adaptados para a tradução pode se tornar muito caro, o que conspiraria contra um dos objetivos iniciais do uso da MT, ou seja, a redução de custos. E, por fim, não devemos esquecer das chamadas “alucinações”, aquelas circunstâncias em que o ChatGPT simplesmente inventa informação quando não consegue responder uma consulta ou resolver um problema. Tendo isso tudo em mente, é duvidoso que os clientes estejam dispostos a usar o ChatGPT como ferramenta de tradução quando a poeira baixar.

Para concluir, deixando o ChatGPT de lado, mas mantendo o foco nas tecnologias por trás dele, já existem sistemas como o motor de IA contextual de tradução da Lilt, que integra LLM + Generative AI + CAT Tools; a ModernMT, que usa Adaptive Machine Translation com excelentes resultados; e o SYSTRAN Neural Fuzzy Adaptation, que também pode ser combinado com uma CAT Tool, entre outros. Esses sistemas, chamados de Human-in-the-Loop, apostam na colaboração entre humanos e máquinas em processos híbridos e podem funcionar de maneira integrada com as CAT Tools. Acredito que, sem levantar tanta poeira, o próximo salto na qualidade da tradução automática esteja vindo por esse lado.

 

*Gostaria de agradecer a leitura e as sugestões da Andrea Gonçalves Pinto e Ricardo Souza.

1 No presente artigo, ao falar em setor de Serviços Linguísticos, incluo tanto agências de tradução como tradutores freelance.

2 https://slator.com/tencent-pits-chatgpt-translation-quality-against-deepl-google-translate/

3 https://www.rws.com/blog/chatgpt-impact-translation-industry/

 4 Bowker, Lynne. Fit-for-purpose Translation. In: Minako O'Hagan (ed.). The Routledge handbook of translation and technology. Oxon & New York: Routledge, 2019

 
 

Jorge Davidson é um tradutor argentino, morador do Rio de Janeiro desde 1997. É doutor em História Social pela Universidade Federal Fluminense e mestre em Letras/Estudos da Linguagem pela PUC-RJ. Tem mais de 15 anos de experiência em tradução e é especializado em conteúdo técnico e científico, acadêmico e de tecnologia. É professor da pós-graduação em tradução da Universidade Estácio de Sá e da Faculdade Phorte.