Tecnologia

Investigadores lançam abaixo-assinado para evitar que língua portuguesa fique dependente das grandes marcas tecnológicas

O abaixo-assinado promovido por investigadores portugueses e brasileiros defende que a dependência das grandes marcas de tecnologias gera "riscos e limitações inéditos à comunicação entre falantes, à cidadania digital e à autonomia cultural”. Primeiro subscritor da iniciativa defende um plano que junte esforços dos diferentes estados lusófonos

António Branco, professor da Faculdade de Ciências da Universidade de Lisboa, defende o desenvolvimento de um modelo de inteligência artificial generativa que agregue os esforços de diferentes países lusófonos
José Fernandes

Um grupo de investigadores portugueses e brasileiros lançou um abaixo-assinado a solicitar aos governos dos países lusófonos que juntem esforços e invistam em modelos de Inteligência Artificial (IA) generativa, que evitem que a língua portuguesa fique dependente das grandes empresas tecnológicas. A iniciativa foi lançada esta segunda-feira pela Conferência Internacional do Processamento Computacional da Língua Portuguesa (PROPOR) e tem por inspiração o que já se faz noutros países. Segundo os investigadores, é a própria autonomia linguística e cultural que está em causa.

A utilização da língua portuguesa virá em breve a ser feita através de permanente intermediação tecnológica. Se essa intermediação continuar assegurada apenas por um pequeno número de gigantes tecnológicas, essa dependência afunilada induzirá riscos e limitações inéditos à comunicação entre falantes, à cidadania digital e à autonomia cultural”, defende o abaixo-assinado.

António Branco, investigador da Faculdade de Ciências da Universidade de Lisboa (FCUL) e primeiro subscritor do abaixo-assinado, considera que é a própria capacidade de comunicar no dia-a-dia dos falantes que tem de ser acautelada com o desenvolvimento de modelos de IA que não dependem das “gigantes” tecnológicas.

Há o risco de se criar uma dependência face a um pequeno grupo de empresas. Se uma destas entidades externas cortar os serviços, podemos ter dificuldade em comunicar uns com os outros. Hoje, se nos cortarem o e-mail podemos sempre tentar usar telemóvel para telefonar, mas nos serviços de IA Generativa, um corte de serviço pode ameaçar a própria capacidade de usar a linguagem para comunicar”, descreve António Branco.

António Branco coordenou o desenvolvimento dos modelos de de IA generativa que dão pelo nome de Albertina e GPT-PT. O especialista não tem muitas dúvidas de que, em breve, a IA generativa vai começar a ser usada rotineiramente para transcrever e resumir telefonemas, traduzir conversas em tempo real com o telemóvel, indicar estados de espírito no atendimento comercial, escrever textos a partir de apontamentos, correções e emendas de informação, comandos para robôs e assistentes digitais, entre muitas outras coisas que hão de ser inventadas nos tempos mais próximos.

Todos estes serviços usam algoritmos que ajudam a processar e produzir informação, mas todos eles têm de ser previamente treinados com grandes volumes de dados que são úteis para conhecer as regras gramaticais, mas também dão a conhecer lógicas, tendências, normas e costumes de uma determinada cultura linguística. E perante o poderio tecnológico e a capacidade de escolha de dados que deverão ser usados no treino da IA, há que tomar medidas, alerta António Branco.

“No limite, há o risco de moldar a maneira de pensar de um país ou até do mundo inteiro!”, diz o professor da FCUL. .

Já há, pelo menos, uma startup da área da medicina a usar os primeiros modelos de IA generativa em português que não dependem das grandes marcas tecnológicas, mas António Branco admite que Albertina e GPT-PT dificilmente se comparam no que toca à robustez dos dados e à sofisticação tecnológica de modelos que deram origem ao ChatGPT e ao Bard e oiutros serviços, que têm vindo a ser desenvolvidos por OpenAI, Google, Meta e Microsoft, entre outras gigantes das tecnologias. E por isso o investigador com carreira feita na área do processamento de linguagem defende que é chegada a hora de os governos lusófonos seguirem o exemplo de Espanha, Suécia, Eslovénia, Arábia Saudita, China e Índia – e dos próprios Estados Unidos que são o país de origem das gigantes tecnológicas, mas não enjeitaram a possibilidade de investir em modelos que não dependem de marcas.

Em todas as iniciativas desenvolvidas para outros idiomas têm por base a lógica do código-aberto, que revela a forma como as tecnologias foram programadas e os diferentes fluxos de dados e processamento da informação.

Estes projetos têm por objetivo democratizar a tecnologia e o acesso aos dados (de treino da IA). É algo que permite criar serviços alternativos que não estão dependentes de um pequeno número de empresas tecnológicas, ao mesmo tempo que permite que diferentes organizações usem nas suas instalações estes modelos, de forma a garantir a confidencialidade dos dados”, responde António Branco.

Na PROPOR, há a consciência de que a decisão final fica dependente daquilo que os governos lusófonos vierem a decidir. António Branco confirma que o desenvolvimento de modelos de IA generativa com a robustez necessária podem implicar investimentos avultados. “Uma vez que os países lusófonos têm capacidades financeiras e tecnológicas diferentes, faz sentido lançar um projeto comum em que há partilha de responsabilidades”, refere o professor da FCUL.

O abaixo-assinado tem como destinatários os vários governos que falam português, mas na PROPOR há a expectativa de que o tema possa escalar a agenda política nos próximos tempos. “Queremos uma tomada de consciência da opinião pública e dos decisores políticos. E queremos que esta iniciativa chegue também à Comunidade de Países de Língua Portuguesa (CPLP) e à Organização de Estados Ibero-Americanos”, conclui o investigador.