Um sistema de Pergunta-Resposta para uma base de Documentos
Resumo
Neste artigo apresentamos a metodologia seguida para a construção de um sistema de pergunta-resposta sobre uma base de documentos em Português. Descrevemos o sistema que tem dois módulos distintos: análise prévia dos documentos (extracção de informação) e processamento das perguntas (recuperação de informação). O nosso sistema procura fazer um processamento, do corpus e da perguntas, suportado em teorias da linguística computacional: análise sintáctica (gramática de restrições), seguida da análise semântica usando a teoria da representação do discurso e finalmente a interpretação semântica/pragmática usando ontologia e inferência lógica. Apresentamos resultados da avaliação do seu desempenho que foi feita sobre dois conjuntos de documentos: textos de dois anos de jornais diários, o Público e a Folha de São Paulo (1994-1995); e um conjunto de documentos jurídicos: decisões do supremo Tribunal, tribunal da Relação e pareceres da Procuradoria Geral da República (cerca de 100.000 documentos).Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Direitos Autorais
A submissão de originais para a Letras de Hoje implica na transferência, pelos autores, dos direitos de publicação. Os direitos autorais para os artigos publicados nesta revista são do autor, com direitos da revista sobre a primeira publicação. Os autores somente poderão utilizar os mesmos resultados em outras publicações indicando claramente a Letras de Hoje como o meio da publicação original.
Licença Creative Commons
Exceto onde especificado diferentemente, aplicam-se à matéria publicada neste periódico os termos de uma licença Creative Commons Atribuição 4.0 Internacional, que permite o uso irrestrito, a distribuição e a reprodução em qualquer meio desde que a publicação original seja corretamente citada.