Um sistema de Pergunta-Resposta para uma base de Documentos
Abstract
Neste artigo apresentamos a metodologia seguida para a construção de um sistema de pergunta-resposta sobre uma base de documentos em Português. Descrevemos o sistema que tem dois módulos distintos: análise prévia dos documentos (extracção de informação) e processamento das perguntas (recuperação de informação). O nosso sistema procura fazer um processamento, do corpus e da perguntas, suportado em teorias da linguística computacional: análise sintáctica (gramática de restrições), seguida da análise semântica usando a teoria da representação do discurso e finalmente a interpretação semântica/pragmática usando ontologia e inferência lógica. Apresentamos resultados da avaliação do seu desempenho que foi feita sobre dois conjuntos de documentos: textos de dois anos de jornais diários, o Público e a Folha de São Paulo (1994-1995); e um conjunto de documentos jurídicos: decisões do supremo Tribunal, tribunal da Relação e pareceres da Procuradoria Geral da República (cerca de 100.000 documentos).Downloads
Downloads
Published
How to Cite
Issue
Section
License
Copyright
The submission of originals to Letras de Hoje implies the transfer by the authors of the right for publication. Authors retain copyright and grant the journal right of first publication. If the authors wish to include the same data into another publication, they must cite Letras de Hoje as the site of original publication.
Creative Commons License
Except where otherwise specified, material published in this journal is licensed under a Creative Commons Attribution 4.0 International license, which allows unrestricted use, distribution and reproduction in any medium, provided the original publication is correctly cited.