Comparação do processo de categorização de documentos utilizando palavras-chave e citações em um domínio de conhecimento restrito

Autores

  • Magali Rezende Gouvêa MEIRELES
  • Beatriz Valadares CENDÓN
  • Paulo Eduardo Maciel de ALMEIDA

Resumo

O processo de categorização requer a extração de elementos representativos de um documento de modo que sua essência possa
ser utilizada na identificação de similaridades e na geração de categorias. O objetivo deste trabalho é analisar as dificuldades e os
resultados encontrados em dois processos diferentes de categorização de documentos de um domínio de conhecimento restrito, o primeiro, baseado no uso de palavras-chave e o segundo, na utilização de citações para representação dos documentos. Para
exemplificar a utilização de diferentes atributos na representação dos documentos foram realizados dois experimentos. O primeiro utilizou um algoritmo de categorização baseado em palavras-chave. O segundo experimento gerou as categorias, utilizando Redes Neurais Artificiais, a partir das citações dos artigos. Em um domínio de conhecimento restrito, como o utilizado neste
trabalho, foi possível evidenciar a dificuldade na formação de grupos que utilizam palavras-chave como atributo do processo de
categorização devido à grande similaridade existente entre aquelas utilizadas pelos autores dos artigos. As citações podem ser,
como mostrado no segundo experimento, um atributo alternativo e mais eficiente para esse processo. A formação de um grupo
de artigos com um expressivo acoplamento bibliográfico e uma forte relação semântica comprovou a validade do método proposto. A presente pesquisa detalha a metodologia utilizada nos experimentos, mostrando a importância de uma criteriosa fase de pré-processamento para a confiabilidade das bases de dados. Este estudo pode contribuir com as pesquisas relacionadas à representação de documentos em processos de categorização e de recuperação de informação.

Downloads

Não há dados estatísticos.

Downloads

Publicado

25-03-2016

Como Citar

Rezende Gouvêa MEIRELES, M. ., Valadares CENDÓN, B. ., & Maciel de ALMEIDA, P. E. (2016). Comparação do processo de categorização de documentos utilizando palavras-chave e citações em um domínio de conhecimento restrito. Transinformação, 28(1). Recuperado de https://periodicos.puc-campinas.edu.br/transinfo/article/view/6010

Edição

Seção

Originais