Planeamento e Gestão de Bibliotecas Digitais: Recuperação da Informaçao em Bibliotecas Digitais

Recuperação de Informação tem como objectivo o armazenamento de documentos e a recuperação automática de informação associada a eles. É uma ciência que pesquisa informações em documentos, pesquisa por metadados que descrevem documentos e pesquisa por base de dados relacionais e isoladas e, também, em base de dados interligadas com a Internet.
A informação, normalmente, está disponível em textos, sons, imagens ou dados.

Como recuperar informação relevante para o utilizador em bibliotecas digitais?

Para o utilizador poder pesquisar com eficiência a informação requerida por este de modo a satisfazer as suas necessidades, o utilizador deve transformar as suas necessidades numa consulta.
Neste caso, esta consulta é traduzida num conjunto de palavra-chave cuja função é recuperar informação das colecções contidas na biblioteca digital.
Como na maioria dos casos o que acontece é que esta consulta nem sempre é feita de forma eficaz, devido à semântica das palavras-chaves introduzidas, então o Sistema de Recuperação de Informação tem como principal objectivo “recuperar o maior número possível de documentos relevantes e o menor número possível de documentos não relevantes”.
Isto porque, os sistemas de RI ordenam os documentos de uma colecção de acordo com o seu grau de relevância, mediante a consulta do utilizador.
Este termo tem um significado importante nesta área, pois é um componente fundamental para calcular a classificação dos documentos num resultado da pesquisa efectuada pelo utilizador.

Ao elaborar-se uma biblioteca digital deve-se ter em atenção aos modelos usados numa pesquisa, como tal devemos ter em atenção alguns passos:

Uma consulta envolve um conjunto de operações, especificadas por termos articulados por operadores booleanos que traduzem as necessidades dos utilizadores;

A operação de indexação envolve a elaboração de construções de dados relacionados com os documentos de uma colecção;

A ordenação envolve o sistema de recuperação de informação conforme a consulta do utilizador através de um grau de homogeneidade entre a consulta e o documento[1].

Neste sistema são usados três modelos para a classificação: modelo booleano, vectorial e probabilístico.
O modelo booleano envolve liga os termos através de conectivos lógicos AND, OR, NOT e considera uma consulta como uma expressão booleana convencional.
O modelo vectorial todos os documento são representados como um vector de termos e cada termo possui um valor associado que indica o grau de importância (peso - weight) deste no documento.
No modelo probabilístico, a ordenação dos documentos é calculada pesando dinamicamente os termos da consulta relativamente aos documentos.
É baseado no princípio da ordenação probabilística (Probability Ranking
Principle). Nesse modelo, busca-se saber a probabilidade de um documento D ser ou não relevante para uma consulta Qa. Tal informação pode ser obtida assumindo-se que a distribuição de termos na colecção seja capaz de informar a relevância provável para um documento qualquer da colecção[2].

[1]RECUPERAÇÃO DA INFORMAÇÃO. [Em linha]. [consult. Em 04 Outubro 2008]. Disponível na Internet em: http://pt.wikipedia.org/wiki/Recupera%C3%A7%C3%A3o_de_informa%C3%A7%C3%A3o

[2] CRISTHIANE, Xavier Figueiredo - Recuperação da Informação e Bibliotecas Digitais.[Em linha]. [consult. Em 04 Outubro 2008]. Disponível na Internet em: http://www.dcc.ufla.br/~olinda/arquivos/apostila_RI.pdf