Ontology lexicalization: Relationship between content and meaning in the context of Information Retrieval1

Autores

  • Marcelo Schiessl
  • Marisa Bräscher

Resumo

Esta proposta visa representar a linguagem natural na forma adequada às ontologias e vice-versa. Para tanto, propõe-se à criação
semiautomática de base de léxicos em português brasileiro, contendo informações morfológicas, sintáticas e semânticas apropriadas para a leitura por máquinas, permitindo vincular dados estruturados e não estruturados, bem como integrar a leitura em modelo de recuperação da informação para aumentar a precisão. Os resultados alcançados demonstram a utilização da metodologia, no domínio de risco financeiro em português, para a elaboração da ontologia, da base léxico-semântica e da proposta do modelo de recuperação da informação semântica. Para avaliar a performance do modelo proposto, foram selecionados documentos contendo as principais definições do domínio de risco financeiro. Esses foram indexados com e sem anotação semântica. Para possibilitar a comparação entre as abordagens, foram criadas duas bases, a primeira representando a busca tradicional, e a segunda contendo o índice construído, a partir dos textos com as anotações semânticas para representar a busca semântica. A avaliação da proposta é baseada na revocação e na precisão. As consultas submetidas ao modelo mostram que a busca semântica supera o desempenho da tradicional e validam a metodologia empregada. O procedimento, embora adicione complexidade em sua elaboração, pode ser reproduzido em qualquer outro domínio.

Downloads

Não há dados estatísticos.

Downloads

Publicado

25-03-2017

Como Citar

Schiessl, M. ., & Bräscher, M. . (2017). Ontology lexicalization: Relationship between content and meaning in the context of Information Retrieval1. Transinformação, 29(1). Recuperado de https://periodicos.puc-campinas.edu.br/transinfo/article/view/5980

Edição

Seção

Originais