Secções
  Entrada CSIG Projetos DBPreserve
Acções do Documento

DBPreserve

Armazéns de dados para a preservação a longo prazo de documentos eletrónicos e bases de dados institucionais

As organizações confiam cada vez mais nas bases de dados como componentes principais dos seus sistemas de arquivo. No entanto, à medida que a quantidade e o pormenor da informação mantida nesses sistemas aumentam, cresce também a preocupação de que dentro de poucos anos a maior parte dela esteja perdida, quando o hardware atual, os sistemas operativos, os sistemas de gestão de base de dados (SGBDs) e mesmo as aplicações ficarem obsoletas tornando os repositórios de informação ilegíveis. O escritório sem papel faz aumentar o risco de se perderem porções significativas da memória organizacional.

Os resultados da investigação nesta área mostram que não se podem adotar  abordagens ingénuas como tentar preservar exemplares das máquinas, do software de sistema e das aplicações, em todas as suas principais versões, de forma a poder usar em qualquer momento as cópias de segurança de todo o sistema relevante. Uma variante disto, em vez de preservar o hardware, sugere a simulação de hardware antigo em novas máquinas. A investigação mais promissora sugere a conversão dos conteúdos da base de dados num formato aberto neutro com uma quantidade significativa de semântica associada (dialectos XML) de modo a torná-los independentes dos pormenores do SGBD.

O projeto DB Preserve pretende responder a este problema, tentando dar mais um passo baseado na seguinte observação: há um paralelo entre a atitude do projetista de um armazém de dados ao abordar o sistema de informação (SI) operacional centrado numa base de dados para especificar um armazém de dados (AD) e a de um arquivista ao analisar um SI organizacional centrado em documentos para especificar um sistema e políticas de arquivo.

Ambos procuram um modelo integrado da organização, fundindo informação de diversas fontes, sistemas e tecnologias, especificando data marts ou classificando séries relacionadas de documentos; ambos têm o requisito de validade a longo prazo; ambos têm uma atitude de avaliação, ignorando pormenores irrelevantes nos dados ou nas séries de documentos para se concentrarem no essencial; ambos querem construir um repositório que se mantenha imutável, exceto no que diz respeito à adição de novos dados ou documentos; e ambos pretendem expor a sua informação de forma simples e sistemática.

Há obviamente diferenças, primeiro que tudo de objetivos. O projetista do AD tenta responder às necessidades de informação da gestão da organização do ponto de vista do apoio à decisão, da monitorização, da análise de tendências e da previsão, enquanto o arquivista quer preservar a memória da organização e dos seus processos, para gerações futuras. As decisões concretas quanto a procedimentos de eliminação podem diferir, de acordo com requisitos específicos, mas o enquadramento geral do trabalho é semelhante.

Seguindo esta intuição básica, o projeto explora a adequação da abordagem AD como veículo para realizar, relativamente a um dado SI, as funções consideradas essenciais do ponto de vista arquivístico tais como avaliação, classificação, eliminação, descrição, acesso, respeitando propriedades como a autenticidade e a integridade.

Duração do projeto

 2007-2010

Líder do projeto

INESC Porto

Instituições participantes

Universidade do Minho e Instituto dos Arquivos Nacionais Torre do Tombo

Financiamento

Fundação para a Ciência e Tecnologia

Investigador CSIG/INESC TEC responsável pelo projeto

Gabriel David

 

destaque.jpg
destaque.jpg
anuncio-contactos

Contactos

CSIG +351 22 209 4199