Termos, relacionamentos e representatividade na indexação de texto para recuperação de informação
Resumo
Uma das fases da recuperação de informação é a indexação dos textos dos documentos. Nesta fase, um conjunto de descritores (termos e/ou relacionamentos entre termos) descreve conceitos (atômicos e/ou complexos) presentes nos textos. Diversas estratégias com tais finalidades são encontrados na bibliografia, algumas consideram dependência de termos e outras não. Com o objetivo de apresentar uma visão geral das estratégias de representação de textos que consideram dependência de termos, são descritas quatro experiências onde as representatividades dos relacionamentos dependem dos termos componentes (estratégias com índices múltiplos, com árvore binária, com triplas e com famílias morfológicas), três onde as representatividades dos relacionamentos dependem de suas próprias freqüências de ocorrência (estratégias com expressões de índice, com pares lematizados e com expressões ternárias), duas onde os relacionamentos são reconhecidos mas não são utilizados como descritores (estratégias com nodos temáticos e com conexões gramaticais) e uma experiência onde os relacionamentos são eminentemente estatísticos (estratégia com bitermos).
Downloads
Downloads
Publicado
Como Citar
Edição
Seção
Licença
Direitos Autorais
A submissão de originais para a Letras de Hoje implica na transferência, pelos autores, dos direitos de publicação. Os direitos autorais para os artigos publicados nesta revista são do autor, com direitos da revista sobre a primeira publicação. Os autores somente poderão utilizar os mesmos resultados em outras publicações indicando claramente a Letras de Hoje como o meio da publicação original.
Licença Creative Commons
Exceto onde especificado diferentemente, aplicam-se à matéria publicada neste periódico os termos de uma licença Creative Commons Atribuição 4.0 Internacional, que permite o uso irrestrito, a distribuição e a reprodução em qualquer meio desde que a publicação original seja corretamente citada.