Pesquisadores criam tecnologia capaz de ler a mente das pessoas
- Atualizado no dia 26 de outubro de 2023 -
Em um estudo publicado em 2019 na Nature (Ref.1), neurocientistas descreveram uma tecnologia que consegue transformar sinais elétricos cerebrais em fala. O feito é o primeiro importante passo que pode fornecer voz para várias pessoas que não podem falar, especialmente pacientes em hospitais.
A nova tecnologia não é ainda acurada o suficiente para ser usada fora do laboratório, e por enquanto está sendo usada para testes e sendo otimizada (!). No entanto, ela já consegue sintetizar sentenças inteiras que são, na sua maioria, inteligíveis. A última tecnologia mais avançado do tipo usava inteligência artificial para traduzir a atividade neural em apenas palavras únicas, em grande parte consistindo apenas de uma única sílaba.
A nova tecnologia não é ainda acurada o suficiente para ser usada fora do laboratório, e por enquanto está sendo usada para testes e sendo otimizada (!). No entanto, ela já consegue sintetizar sentenças inteiras que são, na sua maioria, inteligíveis. A última tecnologia mais avançado do tipo usava inteligência artificial para traduzir a atividade neural em apenas palavras únicas, em grande parte consistindo apenas de uma única sílaba.
------------
(!) ATUALIZAÇÃO:
Atualmente, na prática médica, pessoas que perderam a habilidade de se comunicarem verbalmente ou via sinais gestuais só conseguem se comunicar através de movimentos físicos controlando um cursor, este o qual seleciona palavras ou letras em uma tela. O mais famoso exemplo nessa situação era o recentemente falecido Físico Britânico Stephen Hawking (1942-2018), o qual possuía uma doença neurodegenerativa que o impossibilitava de mexer seus membros e de falar. Hawking usava um dispositivo que era controlado (seu cursor) por um músculo em sua bochecha.
Essa limitação física, onde o paciente ou indivíduo neurologicamente deficiente precisa ativamente digitar as palavras e letras torna o processo de comunicação muito lento - muitas vezes produzindo 10 palavras por minuto, enquanto alguém sem deficiência e saudável consegue produzir acima de 150 - e não serve para pacientes mais limitados ou que possuem problemas que tornem a coordenação para essa digitação muito mais difíceis. Nesse sentido, tecnologias que traduzem atividade neural em fala seria mais do que transformativa para essas pessoas. Porém, decodificar a fala a partir de sinais cerebrais é desafiadora, porque o ato de fala requer um controle dos articuladores do trato vocal muito preciso e multi-dimensionalmente rápido.
Para o desenvolvimento da tecnologia descrita no novo estudo - um decodificador neural para a fala -, os pesquisadores utilizaram cinco voluntários, estes os quais tiveram eletrodos implantados na superfície dos seus cérebros como pate de um tratamento de epilepsia. Primeiro, a atividade cerebral dos participantes lendo centenas de sentenças, em voz alta, foi registrada. Então, os registros obtidos foram combinados com dados de experimentos prévios que determinaram como os movimentos da língua, lábios, mandíbula e laringe criavam vocalização e sons diversos.
Com todos esses dados acumulados em mão, os pesquisadores treinaram um algoritmo de aprendizado profundo (deep-learning) - chamado de rede neural recorrente (RMN, na sigla em inglês) - para o processamento dessas informações, e então incorporaram o programa dentro do decodificador. Basicamente, o decodificador faz uma média representativa sonora e cinemática codificada na atividade cortical humana para sintetizar um discurso audível. Em outras palavras, esse dispositivo transforma sinais cerebrais em movimentos estimados do trato vocal, e transforma esses movimentos em fala sintética. Pessoas aleatórias ouvindo a 101 sentenças decodificadas e sintetizadas conseguiam entender 70% das palavras na média. Além disso, representações articulatórias decodificadas pelo dispositivo mostraram-se altamente conservadas entre os falantes, corroborando a eficiência da nova estratégia de utilizar uma média de movimentos e falas de um banco de dados de várias pessoas. Isso possibilitou um componente do decodificador ser transferível entre os participantes (ou seja, não é necessário um um programa personalizado de tradução).
-----------
> No Blog da Nature, foi disponibilizado um áudio demonstrando duas sentenças sintetizadas pelo decodificador.
----------
Em outro experimento, os pesquisadores pediram a um participante para ler sentenças em voz alta e, então, imitar as mesmas sentenças mas apenas movendo suas bocas sem produzir som. As sentenças sintetizadas desse modo foram de menor qualidade do que aquelas criadas de forma concomitante com o discurso audível, mas razoavelmente entendíveis. Isso reforça que a tecnologia está seguindo o caminho certo mas precisa ainda ser otimizada.
Nesse sentido, por enquanto, a tecnologia já se mostra muito promissora em ler mentes caso a pessoa esteja expressando seu pensamento (discurso) com a movimentação da musculatura da boca. Segundo os pesquisadores, ainda é incerto, porém, se o novo decodificador funcionaria com palavras que as pessoas apenas pensam. Nesse ritmo de progresso, essa ficção científica não está muito longe de se tornar realidade. Futuramente, pessoas mudas talvez não mais precisarão recorrer exclusivamente a sinais gestuais para se comunicarem e pacientes em coma ou profundamente paralisados poderão ser capazes de expressar o que estão pensando.
REFERÊNCIAS
(!) ATUALIZAÇÃO:
> Neurocientistas estão divididos sobre o uso de escaneamentos cerebrais e inteligência artificial (IA) para a leitura de mentes, em especial no contexto de dramáticos avanços tecnológicos nos próximos anos e décadas. Esse tipo de tecnologia pode ameaçar a privacidade mental das pessoas? Ref.2
> Desde o estudo publicado em 2019 (Anumanchipalli et al.), outros estudos vêm reportando cada vez mais otimizações tecnológicas em interfaces cérebro-computador permitindo a leitura de atividades cerebrais associadas a falas, textos e até expressões faciais. Isso inclui um estudo conduzido por Willett et al. reportando decodificação de 62 palavras por minuto em tentativa de fala através de uma neuroprótese, 3,4 vezes mais rápido do que recordes prévios; esse valor se aproxima cada vez mais da velocidade natural de conversação (160 palavras por minuto). Para decodificação de leitura com amplo vocabulário, Chang et al. reportou uma velocidade média de 78 palavras por minuto e com uma média de erro de apenas 25%. Ref.3
------------
- Continua após o anúncio -
Atualmente, na prática médica, pessoas que perderam a habilidade de se comunicarem verbalmente ou via sinais gestuais só conseguem se comunicar através de movimentos físicos controlando um cursor, este o qual seleciona palavras ou letras em uma tela. O mais famoso exemplo nessa situação era o recentemente falecido Físico Britânico Stephen Hawking (1942-2018), o qual possuía uma doença neurodegenerativa que o impossibilitava de mexer seus membros e de falar. Hawking usava um dispositivo que era controlado (seu cursor) por um músculo em sua bochecha.
Essa limitação física, onde o paciente ou indivíduo neurologicamente deficiente precisa ativamente digitar as palavras e letras torna o processo de comunicação muito lento - muitas vezes produzindo 10 palavras por minuto, enquanto alguém sem deficiência e saudável consegue produzir acima de 150 - e não serve para pacientes mais limitados ou que possuem problemas que tornem a coordenação para essa digitação muito mais difíceis. Nesse sentido, tecnologias que traduzem atividade neural em fala seria mais do que transformativa para essas pessoas. Porém, decodificar a fala a partir de sinais cerebrais é desafiadora, porque o ato de fala requer um controle dos articuladores do trato vocal muito preciso e multi-dimensionalmente rápido.
- Continua após o anúncio -
Para o desenvolvimento da tecnologia descrita no novo estudo - um decodificador neural para a fala -, os pesquisadores utilizaram cinco voluntários, estes os quais tiveram eletrodos implantados na superfície dos seus cérebros como pate de um tratamento de epilepsia. Primeiro, a atividade cerebral dos participantes lendo centenas de sentenças, em voz alta, foi registrada. Então, os registros obtidos foram combinados com dados de experimentos prévios que determinaram como os movimentos da língua, lábios, mandíbula e laringe criavam vocalização e sons diversos.
Com todos esses dados acumulados em mão, os pesquisadores treinaram um algoritmo de aprendizado profundo (deep-learning) - chamado de rede neural recorrente (RMN, na sigla em inglês) - para o processamento dessas informações, e então incorporaram o programa dentro do decodificador. Basicamente, o decodificador faz uma média representativa sonora e cinemática codificada na atividade cortical humana para sintetizar um discurso audível. Em outras palavras, esse dispositivo transforma sinais cerebrais em movimentos estimados do trato vocal, e transforma esses movimentos em fala sintética. Pessoas aleatórias ouvindo a 101 sentenças decodificadas e sintetizadas conseguiam entender 70% das palavras na média. Além disso, representações articulatórias decodificadas pelo dispositivo mostraram-se altamente conservadas entre os falantes, corroborando a eficiência da nova estratégia de utilizar uma média de movimentos e falas de um banco de dados de várias pessoas. Isso possibilitou um componente do decodificador ser transferível entre os participantes (ou seja, não é necessário um um programa personalizado de tradução).
-----------
> No Blog da Nature, foi disponibilizado um áudio demonstrando duas sentenças sintetizadas pelo decodificador.
----------
Em outro experimento, os pesquisadores pediram a um participante para ler sentenças em voz alta e, então, imitar as mesmas sentenças mas apenas movendo suas bocas sem produzir som. As sentenças sintetizadas desse modo foram de menor qualidade do que aquelas criadas de forma concomitante com o discurso audível, mas razoavelmente entendíveis. Isso reforça que a tecnologia está seguindo o caminho certo mas precisa ainda ser otimizada.
Nesse sentido, por enquanto, a tecnologia já se mostra muito promissora em ler mentes caso a pessoa esteja expressando seu pensamento (discurso) com a movimentação da musculatura da boca. Segundo os pesquisadores, ainda é incerto, porém, se o novo decodificador funcionaria com palavras que as pessoas apenas pensam. Nesse ritmo de progresso, essa ficção científica não está muito longe de se tornar realidade. Futuramente, pessoas mudas talvez não mais precisarão recorrer exclusivamente a sinais gestuais para se comunicarem e pacientes em coma ou profundamente paralisados poderão ser capazes de expressar o que estão pensando.
REFERÊNCIAS
- Anumanchipalli et al. (2019). Speech synthesis from neural decoding of spoken sentences. Nature 568, 493–498. https://doi.org/10.1038/s41586-019-1119-1
- https://www.nature.com/articles/d41586-023-01486-z
- https://www.nature.com/articles/d41586-023-02703-5
Pesquisadores criam tecnologia capaz de ler a mente das pessoas
Reviewed by Saber Atualizado
on
maio 04, 2019
Rating: