Inteligência Artificial se torna bilíngue sem supervisão humana e sem a ajuda de um dicionário

Hoje as ferramentas de tradução automática são de grande utilidade em várias áreas, especialmente na navegação pela internet, e tudo graças às redes neurais - algoritmos computacionais inspirados no cérebro humano. Porém, treiná-las não é fácil: requer uma quantidade imensa de dados, já que milhões de sentenças previamente traduzidas para o idioma alvo tornam essenciais para fazer um paralelo funcional que permite uma tradução minimamente efetiva. Só que, agora, pesquisadores na área de ciência da computação conseguiram um grande avanço, ao fazerem com que redes neurais otimizadas aprendessem a traduzir sem a necessidade de traduções prévias em paralelo!

Para que você tenha uma ideia do que foi alcançado, imagine que uma pessoa te deu um monte de livros Chineses (escritos em mandarim) e um monte de livros Árabes, todos aleatórios e sem nenhum deles serem traduções um do outro - exemplificando, em mandarim você teria um Harry Potter, um Moby Dick, um Senhor dos Anéis, etc., e, em Árabe, você teria um O Gene Egoísta, um Mil e um Uma Noites, um Agatha Christie, etc. Com todos esses livros em mãos seria lhe dado a tarefa de, basicamente, aprender mandarim e traduzir os livro nessa linguagem para o Árabe... e sem a ajuda de nada, nem mesmo de um dicionário! Sim, parece impossível, certo? Mas não para um computador equipado com uma inovativa inteligência artificial!

A maior parte das máquinas de aprendizado até o momento - na qual redes neurais e outros algoritmos computacionais apredem a partir da experiência - é "supervisionada". Um computador faz uma escolha, recebe a resposta correta e ajusta seu processamento de acordo. No caso das traduções, esse sistema até que funciona bem para linguagens que já são bem estabelecidas e com vasto intercruzamento entre si, como o inglês e o português, onde existem inúmeros textos já traduzidos de um para outro, incluindo uma vasta quantidade de dicionários. Porém, isso já não funciona tão bem para linguagens mais raras, ou mesmo para aquelas muito populares mas sem muitos textos paralelos traduzidos.

Nesse sentido, dois estudos foram concluídos recentemente - a partir de dois grupos de pesquisa distintos, mas com similar metodologia entre ambos - demonstrando uma grande façanha: uma inteligência artificial que consegue traduzir sem a supervisão humana (dizendo se suas escolhas estão certas ou erradas) ou uso de quaisquer textos paralelos pré-traduzidos. As novas máquinas de aprendizado tiram vantagem do fato de que todas as linguagens possuem fortes similaridades no modo como as palavras são organizadas ao redor das outras. Por exemplo, as palavras para cadeira e mesa, para pente e cabelo, e assim por diante, são frequentemente usadas juntas em todas as linguagens. Com isso, se a inteligência artificial consegue mapear essas co-ocorrências, o mapa final criado para uma linguagem irá se parecer muito com o mapa final para outra linguagem qualquer. Nisso, basta descobrir uma forma de parear os padrões de palavras distintas nos dois mapas, obtendo dessa forma um dicionário bilíngue!

- Continua após o anúncio -

A nova IA desenvolvida em ambos os estudos usam duas estratégias de treino bem similares entre si, conhecidas como back translation e denoising. No primeiro, a sentença em uma linguagem é semi-traduzida em outra, então traduzida de volta para a linguagem original. Se a sentença traduzida durante o processo de back translation não é idêntica à original, a rede neural é ajustada para que da próxima vez ela seja mais eficiente. Já no denoising, temos um processo similar, mas ao invés de ir de uma linguagem para outra e voltar, agora temos a adição de ruído à sentença (ao remover ou rearranjar palavras) antes de tentar a tradução de volta ao original. Em conjunto, esses dois métodos ensinam mais profundamente às máquinas de aprendizado as estruturas linguísticas.

Indo para as diferenças entre os dois estudos, um usa o sistema UPV (1), onde as traduções de retorno são feitas de forma mais frequente durante o treinamento. Nesse sistema, criado pelo pesquisador Mikel Artetxe e colaboradores, a eficiência alcançou uma pontuação de 15,56 e 10,21 pontos no BLEU na tradução do Francês-para-Inglês e no Alemão-para-Inglês, respectivamente. Já o outro sistema (2), criado pelo cientista da computação do Facebook, Guillaume Lample e colaboradores, adiciona uma passo extra durante a tradução, e consegue obter até 32,8 pontos no BLEU para certas traduções.

O BLEU é uma avaliação de qualidade da tradução bilíngue. Em comparação, o Google Tranlate, um método supervisionado tradicional de tradução, consegue alcançar uma pontuação de 40. Humanos conseguem pontuar acima de 50. Apesar dos novos sistemas computacionais terem alcançado uma pontuação inferior, eles apresentam resultados significativamente melhores do que uma tradução "palavra por palavra" (onde uma sentença é traduzida de forma literal, termo por termo, não existindo preocupação com a coerência final do conjunto). E considerando a total falta de assistência nas traduções, pesquisadores ao redor do mundo ficaram extremamente surpresos com tal desempenho.

Além disso, ambos os times de pesquisa afirmam que os seus sistemas podem ser aperfeiçoados juntando as técnicas diferenciais usadas entre eles e, além disso, é possível obter um gigantesco avanço incorporando uma relativa pequena quantidade de sentenças paralelas traduzidas para ajudar a inteligência artificial, tornando-a semi-supervisionada. No caso do sistema criado r por Artetxe, a adição de 100 mil sentenças paralelas aumentou a pontuação do BLEU dos 15,56 e 10,21 para 21,81 e 15,24, respectivamente.

Enquanto um método não-supervisionado mais otimizado pode ajudar imensamente na tradução de qualquer tipo de linguagem humana para outra, um método semi-supervisionado otimizado e com um grande banco de dados pode otimizar imensamente as ferramentas automáticas de tradução em geral, criando traduções mais naturais e englobando perfeitamente termos científicos e médicos - menos populares - e até mesmo gírias e variações regionais de linguagem, as quais são criadas constantemente. E, obviamente, isso marca um novo grande avanço no desenvolvimento de inteligências artificiais com uma melhor capacidade de aprendizado.

Sugestão de Leitura: Grande avanço no desenvolvimento de Inteligência Artificial: a IA do Google aprendeu a jogar Go sozinha!

Referências:
1. http://www.sciencemag.org/news/2017/11/artificial-intelligence-goes-bilingual-without-dictionary
2. (1) https://arxiv.org/abs/1710.11041
3. (2) https://arxiv.org/abs/1711.00043