BDBComp
Parceria:
SBC
Tese de Doutorado - Recuperação Vertical de Informação: um estudo de caso na área jurídica

Maria de Lourdes da Silveira

Os sistemas de Recuperação de Informação (RI) foram criados para facilitar o acesso à informa-ção em bibliotecas digitais modernas. Esses sistemas permitem organizar, indexar e recuperar informação sobre os documentos de uma coleção. Nesse processo, a tarefa de indexação tem importância central. Para indexar os documentos é necessário identificar termos de indexação que reflitam o conteúdo semântico dos documentos e que possam ser lembrados pelos usuários no momento de efetuar as consultas. Para normatizar o processo de seleção de termos de indexação, foram criados tesauros. Tesauros são ferramentas desenvolvidas tanto para controlar e padronizar a linguagem de indexação, quanto para facilitar a construção e reformulação de consultas pelos usuários. Tesauros são, em geral, específicos para uma dada área do saber, tais como a médica e a jurídica, dentre outras. Dado um tesauro para uma área específica, pergunta-se: é possível cons-truir um sistema de RI especializado para aquela área do saber que permita a obtenção de resulta-dos de qualidade superior? O objetivo deste trabalho é produzir uma resposta para essa questão. Nossa proposta se baseia no projeto de um sistema de Recuperação Vertical de Informação que, utilizando-se do conhecimento codificado em um tesauro, facilite ao usuário encontrar informa-ção de seu interesse. Para combinar informação evidencial proveniente da consulta do usuário (isto é, as palavras-chave especificadas pelo usuário) com informação evidencial proveniente do tesauro, adotamos o arcabouço teórico das redes Bayesianas. O resultado é um modelo de rede de crenças que leva a uma nova fórmula de ordenação dos documentos na resposta. Para validar nosso sistema, realizamos um estudo de caso voltado para a área jurídica. Utilizando uma coleção de referência composta por jurisprudências dos tribunais federais brasileiros e o Tesauro da Justiça Federal, avaliamos nosso sistema de recuperação vertical de informação. Nossos resultados indi-cam que a combinação de informação proveniente das consultas com informação proveniente do tesauro possibilita ganhos médios em precisão da ordem de 31%.

http://www.ip.pbh.gov.br/ANO5_N1_PDF/ip0501silveira.pdf

Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web

Biblioteca Digital Brasileira de Computação - Contato: bdbcomp@lbd.dcc.ufmg.br
     Mantida por:
LBD