Autoria: Patrícia Marques (LEFT)
A área do processamento de linguagem natural acarreta consigo sérios desafios relativos à compreensão da linguística e tecnologias de inteligência artificial. Implica, desse modo, um conhecimento transversal de diversas ciências.
Professora associada do DEI (Departamento de Engenharia Informática) e investigadora do INESC-ID (Instituto de Engenharia de Sistemas e Computadores), Luísa Coheur é especialista em Processamento de Linguagem Natural. Para além de Sistemas de Tradução, Diálogo e Sistemas de Pergunta/Resposta, os seus interesses passam pela Língua Gestual Portuguesa (LGP) e escrita.
Para um público geral, como descreveria o trabalho em Processamento da Linguagem Natural e quais as bases do mesmo?
Há várias maneiras de olhar para a área do Processamento da Linguagem Natural (PLN) e um elemento importante é o “quando”. No início, as aplicações de PLN eram todas baseadas em regras manuais com uma forte componente linguística. Por exemplo, na minha tese de mestrado, desenvolvi uma interface em português com uma base de dados de recursos turísticos portugueses e, para além da parte computacional, andei a estudar a sintaxe das questões na língua portuguesa. Depois, o PLN abraçou a aprendizagem automática. Durante muitos anos, os trabalhos ainda eram orientados às características linguísticas do problema em mãos. Atualmente, com exceção do processamento das línguas gestuais e pouco mais, é puro deep learning, em que há, infelizmente, muito pouca informação linguística explícita em jogo. Chegámos a um nível que me deixa arrepiada (nunca pensei que fosse possível ter sistemas que parecessem tão “humanos”), mas trabalhar com língua ou com batatas é o mesmo: são apenas dados. Input. Servem para treino ou para adaptar os modelos a alguma tarefa mais específica. Muda a tarefa, mudam os dados de entrada, mas (quase) ninguém vai olhar para as suas especificidades. Claro está que muitas tarefas não estão resolvidas e são ainda muito difíceis. E o que existe para o inglês não existe necessariamente para as outras línguas. Tipicamente, não se conseguem explicar os resultados, as respostas. Mas são tempos interessantes. A área hoje não tem nada a ver com a área de há 10 anos. Para ser mais precisa: a área de hoje não tem nada a ver com a área de há um ano. Ou de há 6 meses. O ritmo de evolução tem sido alucinante.
De que modo é que as ferramentas de tradução automática podem auxiliar o trabalho de tradução? É racional considerar que o emprego de tradutor se encontrará em risco?
Para algumas línguas e domínios, a qualidade da tradução automática é incrível (por exemplo, o Google Translate traduz lindamente a frase anterior para Inglês e Francês). Portanto, nestas situações, já nem se pode dizer que a máquina auxilia o trabalho de tradução: a máquina faz praticamente todo o trabalho de tradução. Quanto ao emprego dos tradutores estar em risco, há uns anos diria que há sempre alguns tipos de textos muito específicos que dificilmente uma máquina traduzirá condignamente. Hoje em dia já não sei se a tradução automática não chegará lá; mas imagino que o tradutor terá sempre (pelo menos nos próximos anos) um papel assegurado como revisor dos textos traduzidos automaticamente. Pensando bem, isto não será só na tradução. O humano terá o seu papel na validação do trabalho de uma Inteligência Artificial.
Estamos a aproximar os sistemas de Pergunta/Resposta a conversas reais. Há limites nesta convergência?
Sim. A máquina faz tudo baseada em probabilidades: qual é a palavra/resposta/parágrafo mais provável? Em termos de sintaxe é incrível o que se consegue produzir (basta ver conversas com o ChatGPT e familiares). No entanto, também se produz imensa coisa sem o mínimo de nexo, mas igualmente eloquente. Se não formos capazes de julgar, vamos começar a ter nas nossas crenças imensa informação errada (não que não tenhamos já), a um nível terrível.
Nos últimos anos, têm-se popularizado imenso ferramentas de criação de arte digital. Não sendo esta a sua área principal de trabalho, com que olhos reage a esta popularização?
Reajo de boca aberta, entre o maravilhada e o horrorizada.
Numa entrevista à GCE-NEIIST, revela que descobriu a área chamada Processamento de Linguagem Natural num livro sobre AI no Caleidoscópio. Poderia contar-nos mais sobre os acontecimento posteriores a este? Como é que o mestrado e toda a aprendizagem consequente alimentou (ou não) o desejo em aprofundar conhecimentos na área?
Eu sempre adorei a língua portuguesa. É maravilhosa e há pessoas que conseguem concatenar palavras de modo magistral, formar frases lindíssimas e escrever livros incríveis. Adoro ler e escrever, de modo que abdicar das Letras no secundário não foi uma decisão trivial. Tirei Matemática, aqui nesta casa, a minha outra grande paixão, mas acabei por seguir o ramo de Computação. E depois descobri que existe essa “coisa”, o Processamento da Linguagem Natural, nesse tal livro velhinho, e apercebi-me que podia conciliar os meus conhecimentos com uma velha paixão que tinha mais ou menos deixado à morte. Depois, foi fazer o mestrado e doutoramento na área. Já não havia mais dúvidas. Casamento perfeito.
Em suma, quais são as tarefas comuns de Processamento de Linguagem Natural e que diferentes abordagens podem ser seguidas? Quais as mais desafiantes e como tem sido a evolução nas técnicas utilizadas, nos anos em que tem acompanhado a investigação?
Passado: sistemas baseados em regras, sistemas baseados em aprendizagem (clássica), sistemas híbridos. Presente: deep learning (e algumas tentativas de injetar conhecimento “persistente”, mas no final é quase tudo deep learning na mesma). Acompanhar o estado da arte é complicado, dado o ritmo dos últimos anos; por outro lado, considero que não tem tanto encanto trabalhar em PLN como antigamente. Podemos fazer coisas lindas em termos de investigação, mas no final ganha sempre a “besta” (os modelos de língua gigantes das grandes companhias).
A professora é também autora de obras literárias galardoadas. O fascínio pela língua e pela sua compreensão têm-na acompanhado desde sempre? Sente, de alguma forma, que o contacto constante com dados e texto de forma computacional e lógica tem vindo a alterar a sua visão para com a literatura e mesmo a forma como aborda o processo de escrita?
Acho que é uma paixão que me vai acompanhar para sempre e a minha visão da literatura e do processo de escrita não mudaram (muito). Hoje tenho aqui este corretor maravilhoso a evitar que me desgrace e, se calhar, amanhã, vou ter o ChatGPT a sugerir-me respostas e/ou parágrafos para um livro. Na verdade, esta ideia é explorada numa história de 2008, chamada mISTério@Tagus. É sobre livros gerados automaticamente e os “heróis” são dois alunos do Técnico do Taguspark.
Para além de investigadora no INESC-ID e autora, é também professora no IST, tendo sido reconhecida na gama de docentes excelentes, um prémio proposto pelo CP em 2012 e atribuído pelos estudantes através do sistema QUCs. Existe de algum modo correlação entre o gosto para ensinar e a prática de boas práticas de docência? Será a otimização das metodologias de ensino proporcional aos anos de experiência? Qual o grau de incentivo e apoio dado à comunidade docente para a melhoria das suas práticas pedagógicas?
A experiência ajuda certamente. Adoro estudar um assunto, pensar como o vou transmitir da melhor maneira, preparar uma aula e dá-la, mas, por vezes, falho miseravelmente e tento melhorar na próxima iteração (otimizo e ganho experiência). Infelizmente, só muito recentemente é que percebi que posso pôr a criatividade (e escrita) ao serviço do ensino – com Escape Games, enunciados de projeto com uma história, etc.
Quanto às boa práticas de docência – e estou agora a tirar uma pós graduação de um ano, “Pedagogia do Ensino Superior”, no Instituto de Educação, pelo que tenho refletido bastante sobre o assunto – é consensual que alguns dos elementos fulcrais são: ter o conhecimento do tema a lecionar e fazer uma boa preparação das aulas. No entanto, é também fundamental passar o entusiasmo pelos tópicos aos alunos (se este entusiasmo não existir naturalmente, nada feito). Na minha opinião, tem de haver “fun” de ambos os lados, mesmo que a matéria seja dura de adquirir (e ainda mais nestes casos). Assim, diria que o gosto de ensinar (que é algo que se tem ou não; eventualmente ganha-se) é fundamental.
Quanto ao incentivo dado à comunidade docente, infelizmente, a componente de investigação continua a ser a mais valorizada; mas há vários esforços nesse sentido. Um exemplo são os Projectos de Inovação Pedagógica (os PIP) do CP. Há uns anos, ganhei um desses projectos e consegui montar um Escape Game físico, no Taguspark, para alunos da LEIC-T (nas disciplinas de Lógica de Programação e Álgebra Linear). Os alunos estavam “fechados” num quarto e tinham de resolver quebra-cabeças relacionados com as matérias que estavam a estudar para conseguir “escapar”. Foi muito giro. Vou tentar ativar de novo o jogo.
Numa newsletter do INESC-ID, menciona que, se pudesse, “mudava o tempo”. Cada vez mais, ouvimos desejos de que o dia tenha mais horas, ao invés de que a vida tenha mais dias. Como concilia as suas várias paixões e em que projeto (ou aventura) gostaria de embarcar, que esteja apenas suspensa pelas correntes do tempo?
Não concilio muito bem. Durante a semana, em especial desde que o novo modelo entrou em vigor, quando estamos em períodos de aulas não tenho capacidade para pensar em mais nada a não ser a disciplina que estou a dar (o que não é dramático, mas é intenso). Não há praticamente espaço (também mental) para outras paixões, outros projetos ou aventuras. Quando não estou em trimestres de aulas, os fins de semana voltam a pertencer-me (e, às vezes, os fins do dia também). Agora, vou entrar num desses períodos. Para além de tempo para investigação, acho que estou genuinamente interessada em pedagogia e gostava de aprender mais. Possivelmente, será o tópico do meu próximo projeto. Na verdade, adoro fazer investigação, mas adoro ainda mais ser “Professora”, ensinar, em especial desde que descobri que há muito espaço para a criatividade. Tenho muito gosto (e orgulho) em ser Professora, que escrevo sempre com “P” maiúsculo.
Agradecimentos especiais à professora Luísa Coheur pela disponibilidade e abertura nas respostas.