BDBComp
Parceria:
SBC
Indexação de Dados Biológicos baseado em Vetores de Sufixo Generalizados para Disco

Felipe Alves Da LouzaCristina Dutra de Aguiar Ciferri

Com o avanço tecnológico, a quantidade de dados biológicos coletados, armazenados e disponíveis para análise tem aumentado exponencialmente. Esses dados referem-se às sequências biológicas de DNA, RNA e de proteínas e são armazenadas em bancos de dados biológicos (BDBs) como cadeias de caracteres. O casamento exato de cadeias de caracteres desempenha um papel importante em pesquisas por similaridade em BDBs, atuando como um filtro na etapa de alinhamento de sequências biológicas. Além disso, para auxiliar essas pesquisas, existem os índices e, dentro desse contexto, o vetor de sufixo é uma estrutura de dados muito utilizada. Desafios relacionados ao uso de vetores de sufixo na indexação de BDBs referem-se à construção do índice para grandes cadeias, ao armazenamento e à manipulação eficiente de sua estrutura em memória externa (ou seja, disco), e à indexação de conjuntos de cadeias por meio de vetores de sufixo generalizados. Na literatura, trabalhos correlatos que usam vetores de sufixo apresentam as seguintes limitações. Por um lado, trabalhos que usam vetores de sufixo generalizados são direcionados apenas à memória primária. Por outro lado, trabalhos voltados à manipulação de vetores de sufixo em disco não enfocam vetores de sufixo generalizados. Essas limitações motivam o desenvolvimento deste projeto de mestrado, o qual tem por objetivo investigar a indexação persistente de dados biológicos baseado em vetores de sufixo generalizados.

http://www.lbd.dcc.ufmg.br/colecoes/wtdbd/2012/0014.pdf

Caso o link acima esteja inválido, faça uma busca pelo texto completo na Web: Buscar na Web

Biblioteca Digital Brasileira de Computação - Contato: bdbcomp@lbd.dcc.ufmg.br
     Mantida por:
LBD