Evolução dos sistemas artificiais de armazenamento e recuperação de informações
Elysio Mira Soares de Oliveira

Publicado na: www.geocities.com/SiliconValley/Sector/3172
2a, ed, em 19/10/1998



Resumo
Descrevem-se, através de modelos, a evolução dos sistemas de armazenamento e recuperação de informações. Procura-se salientar o impacto nos métodos tradicionais de tratamento da informação, causado com a adoção do computador. Enfatiza-se a utilização do computador como instrumento capaz de, não só simular processos manuais, mas também de simular mecanismos mentais de processamento da informação.

    Para maior compreenção dos sistemas artificiais de armazenamento,  processamento e recuperação de informações, torna-se necessário que analisemos inicialmente os mecanismos do sistema natural (cérebro), o qual serve de modelo para o desenvolvimento dos sistemas artificiais.
    No sistema natural, a resposta se dá mediante um estímulo (pergunta) que aciona o mecanismo de processamento e resposta do sistema. Quando acionado, passa processar as informações armazenadas. O processamento se dá através da análise, seleção, comparação lógica e classificação dessas informações, reagindo com uma resposta conforme os padrões definidos pelo estímulo.

Principais características do sistema natural de armazenamento, processamento e recuperação:

    A característica temporária da memória do sistema natural, foi um dos fatores que impulsionaram o desenvolvimento de outros meios e suportes para o registro de informações. Entre os meios desenvolvidos, podemos destacar a ESCRITA como o mais comum e o PAPEL como o suporte de registro predominante.

    A introdução desse novo elemento de armazenamento, altera substancialmente o comportamento do sistema natural. A medida que o novo sistema recebe um estímulo, passa a processar não só as informações armazenadas na memória mas também, se necessário, as armazenadas nos meios artificiais, para depois reagir com a resposta. O tempo de resposta do sistema descrito é diretamente proporcional ao volume de informações armazenadas artificialmente. Esse fator torna o sistema impraticável quando o volume armazenado é grande.

Principais características do sistema natural com suporte artificial de armazenamento:

  • morosidade na resposta;
  • capacidade ilimitada de respostas;
  • memória permanente;
  • alto índice de precisão;
  • alto índice de revocação.
  •     A morosidade no processo de resposta gera um grave problema e a única saída disponível até meados da década de 60 foi a inversão do fluxo de processamento do sistema natural. Essa inversão gerou um novo modelo. Esse modelo, fruto dessa inversão, se baseia no princípio da organização prévia das informações, criando meios de acesso para agilizar o fornecimento ou indicação de respostas.

        Esse modelo, tradicionalmente utilizado por bibliotecas e centros de documentação, tem como princípio fundamental a geração de respostas antes de receber os estímulos. Esse processo consiste na geração de meios de respostas (Classificação da informação e geração de catálogos ou índices) com base na previsão das perguntas mais freqüentes a que o sistema estará sujeito.  Essa característica influi negativamente na capacidade de respostas do sistema por se limitar as respostas pré determinadas.

        Essa deficiência do sistema tradicional foi criticada pela primeira vez pelo Dr. Vannevar Bush, diretor do Serviço de Pesquisa e Desenvolvimento dos Estados Unidos. Em 1945, Dr. Bush afirmou: "Nossa incapacidade de atingir o documento (informação) é provocada em grande parte pelos sistemas artificiais de indexação (sistemas que se utilizam de índices). Quando dados de qualquer espécie são armazenados, são eles colocados em ordem alfabética ou numérica, e a informação é encontrada (quando chega a sê-lo) descendo-se de uma subdivisão para outra. Ela se encontra em um único lugar, a menos que se usem duplicatas; a pessoa precisa conhecer as regras que a conduzirão pelo caminho certo, ao fim do qual encontrará a informação, e as regras são complicadas. Além disso, tendo encontrado um ítem, a pessoa emerge do sistema, mas torna a mergulhar a procura de outro, logo depois... A mente humana não trabalha dessa maneira. Opera por associação. Tendo dominado um ítem, agarra-se imediatamente a outro que lhe é sugerido por associação de idéias, de acordo com alguma intricada rede de caminhos que as células do cérebro proporcionam. Possui outras características além dessa, é claro; trilhas não muito frequentadas são propensas a se apagarem, os ítens não se encontram sempre presente, a memória é transitória. No entanto, a velocidade da ação, o enredado das trilhas, as minúcias das imagens mentais, mais do que qualquer outra coisa na natureza, são dignos de admiração."

    Principais características do sistema tradicional de tratamento e recuperação da informação:

  • rapidez na resposta;
  • capacidade limitada de respostas;
  • memória permanente;
  • morosidade na emissão de meios de acesso
  • baixo índice de revocação;
  • baixo índice de precisão.
  •      Fundamentados no modelo tradicional de processamento de informação e com os novos recursos tecnológicos advindos com o computador, surgiram técnicas até então inaplicáveis sem os recursos da informática. O computador, com suas qualidades comprovadas na simulação de processos, gradativamente foi sendo alvo de atenção daqueles a cargo dos serviços de tratamento de informações. Sua grande capacidade em simular tarefas repetitivas, exigidas pelos sistemas tradicionais de processamento, desviou a atenção de alguns quanto a sua capacidade no processamento de informações. A elaboração de catálogos classificados, índices numéricos ou alfabéticos, controles estatísticos e controles burocráticos foi o grande alvo de aplicação da máquina.

        Esse novo método de tratamento de informações, fruto da adaptação do modelo tradicional, muita contribuição trouxe aos profissionais a cargo da organização de informações, trazendo pouca ou nenhuma contribuição aos usuários dessas informações.

    Principais características do sistema tradicional adaptado:

  • rapidez na resposta;
  • capacidade limitada de respostas;
  • memória permanente;
  • rapidez na emissão de meios de acesso;
  • baixo índice de revocação;
  • baixo índice de precisão.
  •     A capacidade de resposta do sistema tradicional adaptado, é diretamente proporcional ao número previsto de perguntas a serem respondidas pelos meios de acesso. É impossível prever todas as perguntas que poderão ser dirigidas a um sistema de informação. Para o dimensionamento dos meios de acesso em um sistema tradicional, recorre-se a previsão de respostas para as perguntas mais freqüentes.(catálogo de autor, catálogo de título, catálogo de assunto, etc). Assim sendo, os usuários continuam presos as formas pré coordenadas de acesso a informações.

        No início da década de 60, um cirurgião inglês, John Rowan Wilson, pesquisador dos mecanismos do cérebro, já afirmava que os dois, cérebro e computador, são, de fato, capazes de processar as informações tais quais as recebem, e separar das demais a informação relevante para uma determinada situação específica.

        As qualidades descritas por Wilson, proporcionaram um grande avanço nos métodos e técnicas para a armazenamento e processamento de informações. A comprovada capacidade do computador na simulação dos mecanismos mentais de processamento de informações foram fatores que levaram a um novo modelo de sistema. Para a alimentação desse novo sistema, não se requer o processamento prévio das informações. As rotinas de comparação, associação, classificação, ordenação e geração de meios, obrigatórias na fase de alimentação do sistema tradicional deixam de existir como rotinas de alimentação do sistema artificial, dando lugar à rotina de descrição da informação a ser referenciada ou armazenada (meta dado). Essa rotina consiste no fornecimento de dados que representem fielmente a informação, permitindo ao computador interpretá-los, processá-los e fornecê-los de acordo com os parâmetros impostos na pergunta pelo usuário.

    Principais características do sistema artificial descritivo:

  • rapidez na resposta;
  • capacidade ilimitada de resposta;
  • memória permanente;
  • alto índice de revocação;
  • alto índice de precisão.
  •     O sistema artificial descritivo de armazenamento e processamento, se fundamenta na armazenamento de informações em arquivos relacionais estruturados, gerenciados por um programa específico capaz de manipular relações e associações conceituais. Estes arquivos constituem base de dados com determinada estrutura lógica, onde todos os dados relativos a uma informação são registrados uma única vez.

        Há uma certa complexidade neste processo, pois armazenar, processar e recuperar informação, é bem diferente que armazenar, processar e recuperar palavras em um contexto. O Processamento da Informação é uma atividade  que requer métodos e técnicas. A informação contém ambigüidades (um termo ora representa um conceito e ora pode representar outro); A informação contém relações conceituais (um termo dependendo do contexto pode representar vários conceitos). Alen Kent, há 38 anos atrás já dizia:

    "O problema de planejar um sistema de recuperação da informação seria um problema trivial se (a) todo o acontecimento que incidisse sobre a consciência de qualquer ser humano provocasse o mesmo fluxo de observações; (b) se cada observador utilizasse palavras idênticas, formando as mesmas configurações, para descrever cada um desses acontecimentos, e (c) se cada pessoa interessada em aprender algo sobre o acontecimento fizesse perguntas usando a mesma terminologia."
        Tem surgido sistemas que se propõe a gestão da informação considerando-a como um mero conjunto de "palavras" (strings) e não de conceitos. Sistemas que reproduzem nossos antigos catálogos de fichas e os transformam em Base de Dados e crêem, ou se fazem acreditar, que criaram um "Sistema de Armazenamento e Recuperação de Informação". Consideram uma Base de Dados  como um catálogo de livros, ou fichário, como o nome pode sugerir, e não como um conjunto de registros estruturados que contém ou descrevem a informação.



    IP -Índice de Precisão (precision)
    É o resultado da relação entre o número de de informações relevantes recuperadas (R) e o total de informações recuperadas (T), ou seja: IP=R/T.

    IR - Índice de Revocação (recall):
    É o resultado da relação entre o número de informações relevantes recuperadas (R) e o total de informações relevantes armazenadas (A), ou seja: .IR=R/A


    Referências Bibliográficas

    1 - ARAÚJO, Erastosteles E. R. de - Revocação (recall) e precisão (precision) no               SDI/CIN/CNEN. Ciência da Informação, Rio de Janeiro, 8(1):47-50, 1979.

    2- BUSH, V. - As we may think. Atlantic Monthly, 176:101-108, jul. 1954. apud KENT, Allen - Manual da recuperação mecânica da informação. São Paulo, Polígono, 1972. p.9

    3- CERVO, A. L. & BERVIAN, P. A. - Metodologia científica. 2 ed. rev. ampl. São Paulo, McGraw-Hill do Brasil, 1978.

    4- KENT, Allen - Manual da recuperação mecânica da informação. São Paulo, Polígono, 1972.

    5- OLIVEIRA, E.M.S. de & PACKER, A.L. - Metodologia utilizada pelo SEADE/DOCPOP para a coleta e processamento de informações bibliográficas. São Paulo, 1984. 15 p. (Apresentado no I Seminário sobre Automação de Bibliotecas e Centros de Documentação. São José dos Campos, 4-7 dez. 1984).

    6- UNISIST. International Centre for Bibliographic Description. - Reference manual for machine readable bibliographic description. 2 ed. rev. London, UNIBID, 1981.

    7- WILSON, J.R. et. al - A mente. Rio de Janeiro, José Olympio, 1965. p. 179. (Biblioteca Científica Life, 5).