Acções do Documento
DBPreserve
Armazéns de dados para a preservação a longo prazo de documentos eletrónicos e bases de dados institucionais
As organizações confiam cada vez mais nas bases de dados como componentes principais dos seus sistemas de arquivo. No entanto, à medida que a quantidade e o pormenor da informação mantida nesses sistemas aumentam, cresce também a preocupação de que dentro de poucos anos a maior parte dela esteja perdida, quando o hardware atual, os sistemas operativos, os sistemas de gestão de base de dados (SGBDs) e mesmo as aplicações ficarem obsoletas tornando os repositórios de informação ilegÃveis. O escritório sem papel faz aumentar o risco de se perderem porções significativas da memória organizacional.
Os resultados da investigação nesta área mostram que não se podem adotar abordagens ingénuas como tentar preservar exemplares das máquinas, do software de sistema e das aplicações, em todas as suas principais versões, de forma a poder usar em qualquer momento as cópias de segurança de todo o sistema relevante. Uma variante disto, em vez de preservar o hardware, sugere a simulação de hardware antigo em novas máquinas. A investigação mais promissora sugere a conversão dos conteúdos da base de dados num formato aberto neutro com uma quantidade significativa de semântica associada (dialectos XML) de modo a torná-los independentes dos pormenores do SGBD.
O projeto DB Preserve pretende responder a este problema, tentando dar mais um passo baseado na seguinte observação: há um paralelo entre a atitude do projetista de um armazém de dados ao abordar o sistema de informação (SI) operacional centrado numa base de dados para especificar um armazém de dados (AD) e a de um arquivista ao analisar um SI organizacional centrado em documentos para especificar um sistema e polÃticas de arquivo.
Ambos procuram um modelo integrado da organização, fundindo informação de diversas fontes, sistemas e tecnologias, especificando data marts ou classificando séries relacionadas de documentos; ambos têm o requisito de validade a longo prazo; ambos têm uma atitude de avaliação, ignorando pormenores irrelevantes nos dados ou nas séries de documentos para se concentrarem no essencial; ambos querem construir um repositório que se mantenha imutável, exceto no que diz respeito à adição de novos dados ou documentos; e ambos pretendem expor a sua informação de forma simples e sistemática.
Há obviamente diferenças, primeiro que tudo de objetivos. O projetista do AD tenta responder à s necessidades de informação da gestão da organização do ponto de vista do apoio à decisão, da monitorização, da análise de tendências e da previsão, enquanto o arquivista quer preservar a memória da organização e dos seus processos, para gerações futuras. As decisões concretas quanto a procedimentos de eliminação podem diferir, de acordo com requisitos especÃficos, mas o enquadramento geral do trabalho é semelhante.
Seguindo esta intuição básica, o projeto explora a adequação da abordagem AD como veÃculo para realizar, relativamente a um dado SI, as funções consideradas essenciais do ponto de vista arquivÃstico tais como avaliação, classificação, eliminação, descrição, acesso, respeitando propriedades como a autenticidade e a integridade.
Duração do projeto
2007-2010
LÃder do projeto
INESC Porto
Instituições participantes
Universidade do Minho e Instituto dos Arquivos Nacionais Torre do Tombo
Financiamento
Fundação para a Ciência e Tecnologia
Investigador CSIG/INESC TEC responsável pelo projeto
Gabriel David