[go: up one dir, main page]

Academia.eduAcademia.edu

Repositórios digitais e confiança: um exemplo de prevenção digital: o RODA

2015

UNIVERSIDADE DE LISBOA FACULDADE DE LETRAS Repositórios Digitais e Confiança Um exemplo de repositório de Preservação Digital: o RODA Luis Miguel Nunes Corujo Dissertação Mestrado em Ciências da Documentação e Informação Área de Especialização: Arquivística 2014 UNIVERSIDADE DE LISBOA FACULDADE DE LETRAS Repositórios Digitais e Confiança Um exemplo de repositório de Preservação Digital: o RODA Luis Miguel Nunes Corujo Dissertação orientada pelo Professor Doutor Paulo Alberto Farmhouse e pelo Professor António Gil Matos Mestrado em Ciências da Documentação e Informação Área de Especialização: Arquivística 2014 “There are 10 kinds of people. Those who understand binary notation, and those who do not.” Sumário Índice de Ilustrações..................................................................................................................... IV Dedicatória .................................................................................................................................... V Agradecimentos ........................................................................................................................... VI Resumo........................................................................................................................................ VII Abstract ...................................................................................................................................... VIII Siglas .............................................................................................................................................. 1 1 - Introdução ................................................................................................................................ 5 2 - Preservação Digital ................................................................................................................... 9 Preservação … ........................................................................................................................... 9 ... Digital .................................................................................................................................. 12 O Objecto da Preservação Digital ............................................................................................ 17 Definições e Características ................................................................................................ 17 Camadas constituintes do Objecto ..................................................................................... 22 Estratégias de Preservação ..................................................................................................... 25 Quadro Teórico de Referência ................................................................................................ 31 Para concluir o Estado da Arte da Preservação Digital? ......................................................... 34 3 - Repositórios Digitais ............................................................................................................... 41 Conceito e Definição ............................................................................................................... 42 Âmbitos de Utilização.............................................................................................................. 46 Repositórios e (/ou) Arquivos Digitais ................................................................................. 46 Repositórios de Acesso Aberto ....................................................................................... 53 Repositórios Institucionais e/ou Temáticos ........................................................................ 53 Bibliotecas Digitais .............................................................................................................. 59 Para concluir o Estado da Arte dos Repositórios Digitais ....................................................... 63 4 - O Modelo OAIS ....................................................................................................................... 65 O Modelo de Ambiente Externo ............................................................................................. 66 O Modelo de Informação do OAIS .......................................................................................... 68 O Objecto de Dados ............................................................................................................ 69 O Objecto de Informação .................................................................................................... 69 A Informação de Representação ......................................................................................... 69 Taxonomia dos Objectos de Informação ............................................................................ 72 Informação de Conteúdo ................................................................................................ 72 I Informação de Descrição de Preservação ....................................................................... 72 Informação de “Empacotamento” .................................................................................. 74 Informação de Descrição................................................................................................. 75 Pacotes de Informação........................................................................................................ 76 O Modelo Funcional do OAIS .................................................................................................. 79 OAIS e a Normalização ............................................................................................................ 85 Metainformação de preservação ........................................................................................ 85 Confiança e Certificação ...................................................................................................... 87 Interface Produtor-Arquivo ................................................................................................. 89 Metainformação Estrutural ................................................................................................. 90 Para Concluir o Estado da Arte do OAIS .................................................................................. 90 5 - Confiança e Certificação ......................................................................................................... 93 Conceitos ................................................................................................................................. 94 Confiança ............................................................................................................................. 94 A Confiança no Âmbito dos Repositórios Digitais ............................................................... 98 Responsabilidades ................................................................................................................. 103 Certificação............................................................................................................................ 105 Instrumentos de suporte à Certificação ................................................................................ 106 Certificação e Auditoria: o TRAC e a ISO 16363:2012 ....................................................... 108 O Catálogo de Critérios Alemão: NESTOR e o Certificado DINI......................................... 112 Os 10 Princípios ................................................................................................................. 115 Avaliação de Repositórios: Data Seal of Approval ............................................................ 116 European Framework for Audit and Certification of Digital Repositories ........................ 117 Aplicação de Critérios e Certificação ................................................................................. 118 Avaliação de Riscos: DRAMBORA .......................................................................................... 119 Concepção e Planeamento de Repositórios: o PLATTER ...................................................... 122 O ponto de vista dos utilizadores .......................................................................................... 123 Para concluir o estado da arte em Certificação de Repositórios Digitais ............................. 125 A manutenção da assinatura digital. ................................................................................. 126 6 - Repositório de Objectos Digitais Autênticos (RODA) ........................................................... 129 O Projecto.............................................................................................................................. 129 Metainformação no RODA .................................................................................................... 130 Plataforma de Desenvolvimento ........................................................................................... 131 Pacotes de Informação.......................................................................................................... 133 II Modelo de Dados .................................................................................................................. 134 Planeamento de Preservação: o CRiB ................................................................................... 135 Presentemente: Desafios e Oportunidades .......................................................................... 137 O Projecto SCAPE .............................................................................................................. 138 O SCAPE Preservation Environment .............................................................................. 138 7 - Comparação e aplicação de Documentos Certificação ........................................................ 143 O Quadro Comparativo ......................................................................................................... 143 O TRAC, a ISO 16363:2012 e o NESTOR ................................................................................ 144 Comparação entre critérios/métricas TRAC e ISO 16363:2012 ........................................ 145 Comparação entre critérios/métricas TRAC e NESTOR ..................................................... 147 Comparação entre critérios/métricas NESTOR e ISO 16363:2012.................................... 149 Aplicação ao RODA ................................................................................................................ 153 TRAC .................................................................................................................................. 153 ISO 16363:2012 ................................................................................................................. 156 NESTOR .............................................................................................................................. 162 Conclusão à comparação e à aplicação ................................................................................. 163 8 – Conclusão ............................................................................................................................ 165 Referências Bibliográficas ......................................................................................................... 171 ANEXOS ..................................................................................................................................... 195 Anexo 1 - Tabela comparativa do TRAC ................................................................................ 197 Anexo 2: Tabela Comparativa do NESTOR (2ª Edição) .......................................................... 213 Anexo 3: Tabela Comparativa da ISO 16363:2012 ................................................................ 223 III Índice de Ilustrações Figura 1 - Modelo de Contextualização de Objectos digitais (Thomaz, 2012) ............................ 37 Figura 2 - Abstracção de Repositório .......................................................................................... 44 Figura 3 - O Modelo de Ambiente de um OAIS ........................................................................... 66 Figura 4 - Obtenção de Informação a partir dos Dados .............................................................. 70 Figura 5 - O Pacote de Informação .............................................................................................. 76 Figura 6 - O Modelo de Informação OAIS ................................................................................... 79 Figura 7 - O Modelo Funcional OAIS ........................................................................................... 80 Figura 8 - O Modelo Cornell para Atributos de Repositórios Digitais Confiáveis...................... 107 Figura 9 - Ciclo de Vida da Preservação Digital (SCAPE) ............................................................ 138 Figura 10 - Implementação de referência do SCAPE Preservation Environment ..................... 140 IV Dedicatória Em homenagem à minha família, particularmente ao meu pai e à minha mãe, pelo carinho, amparo absoluto e valores que continuamente me passaram, e que continuam a ser pilares estruturantes da minha vida. Ao meu irmão, amigo, conselheiro confidente e companheiro, um verdadeiro alter-Ego da minha pessoa. Um tributo muito especial à minha mulher, aquela molécula de carbono indispensável à sobrevivência do meu Ser. Pelo Amor, apoio, e pela sua jovialidade contagiante e forma de ver a Vida, e que me desafia a abrir-me ao Mundo. A todos os meus amigos, colegas, companheiros e conhecidos que passaram pela minha vida, estejam ou não presentes nela, pela marca que deixaram não só na minha memória, mas também na minha vida. V Agradecimentos Aos meus professores, verdadeiros Mestres do Conhecimento, muito particularmente ao Mestre Francisco Barbedo, pelos desafios e apoio que me tem concedido, desde o curso de especialização, passando pelo Arquivo Distrital do Porto e pela Direcção-Geral de Arquivos. Um verdadeiro exemplo de competência e profissionalismo descomprometido. Aos meus amigos e colegas da Torre do Tombo (independentemente do nome do organismo ou instituição que alberga o edifício!) e Arquivos Distritais (especialmente no do Porto e o de Braga), pelos ensinamentos e pela forma como me ensinaram a vivenciar a prática arquivística, bem longe de “academismos empoeirados”. A lista é longa, mas estão bem presentes na minha lembrança. Foi uma regalia a oportunidade de ter trabalhado convosco. Estes organismos foram e continuam a ser a minha Alma Mater. Aos meus amigos e colegas da Comunidade do RODA, Miguel Ferreira, Luis Faria e Rui Castro, por suportarem as minhas infindáveis questões e pedidos. Aos meus amigos e colegas da Faculdade de Letras da Universidade de Lisboa, especialmente aos Professores António Gil Matos, Carlos Guardado da Silva, Jorge Revez e Paulo Alberto Farmhouse, pela força e incentivo. Às minhas amigas e colegas de trabalho da Biblioteca da Faculdade de Ciências da Universidade de Lisboa, nomeadamente a Margarida Pino, a Ana Fraga e Teresa Boa, pelo cuidado e atenção que tiveram a escutar as minhas dúvidas. Aos meus amigos e familiares que tiveram a paciência de me acompanhar na produção deste trabalho, e de todas as incertezas, apreensões e anseios ao longo desta lide, manifesto o meu mais sincero e profundo reconhecimento. VI Resumo Este trabalho pretende situar os repositórios digitais no seio da Preservação Digital e analisar como estes podem ser considerados dignos de confiança por parte dos seus utilizadores. Nesse sentido são abordadas normas e outros documentos com requisitos que têm como fim a certificação, como elementos que promovem e reforçam a confiança nos repositórios digitais, sendo proposta uma comparação entre o TRAC, a ISO 16363:2012 e o NESTOR. Neste âmbito é igualmente apresentado o RODA, repositório orientado para a preservação digital a longo prazo, aventando-se a sua avaliação com base nos requisitos propostos pelos referidos documentos. PALAVRAS-CHAVE: Preservação Digital; Repositório Digital; Objecto Digital; Confiança; Certificação; OAIS; TRAC; ISO 16363:2012; NESTOR; RODA; Informação Electrónica VII Abstract This work aims to place the digital repositories within the Digital Preservation subject, and analyze how these can be considered trustworthy by their users. In this sense, it addresses standards and other documents that present requirements as an end for certification, and as elements that promote and strengthen the trust in digital repositories, also including a comparison proposal between the TRAC, the ISO 16363:2012, and the NESTOR standards. Also in this context is presented the RODA, a long-term preservation-oriented digital repository, venturing its assessment based on the requirements proposed by the said documents. KEYWORDS : Digital preservation; Digital Repository; Digital Object; Trust ; Certification; OAIS; TRAC; ISO6363:2012; NESTOR; RODA; Electronic Information VIII Siglas AIP – Archival Information Package ALA - American Library Association APBAD – Associação Portuguesa de Bibliotecários, Arquivistas e Documentalistas ASCII - American Standard Code for Information Interchange BNF - Bibliothèque Nationale de France CCSDS - Consultative Committee for Space Data Systems CEDARS - CURL Exemplars in Digital Archives CLIR - Council on Library and Information Resources CNES - Centre National d’Études Spatiales CPA - Commission on Preservation and Access CRL - Center for Research Libraries DAE - Documento de Arquivo Electrónico DANS - Data Archiving and Networked Services DGArq – Direcção-Geral de Arquivos DGLAB – Direcção-Geral do Livro, Arquivo e Bibliotecas DINI – Deutsche Initiative für NetzwerkInformation. (German Initiative for Network Information) DIP - Dissemination Information Package DCC - Digital Curation Centre DLM Forum - Document Lifecycle Management (até 2002 era Données Lisibles par Machine) DPC - Digital Preservation Coalition DPE – Digital Preservation Europe DSA - Digital Seal of Approval DRAMBORA - Digital Repository Audit Method Based on Risk Assessment EAD – Encoded Archival Description EESSI - European Electronic Signature Standardization Initiative 1 GDFR - Global Digital Format Registry HATII - Humanities Advanced Technology and Information Institute HTML - HyperText Markup Language IAN/TT – Instituto dos Arquivos Nacionais/Torre do Tombo iARQ - informação de arquivo ICA – International Council of Archives ICPSR - Inter-University Consortium for Political and Social Research IDA - Interchange of Data between Administrations IFLA - International Federation of Library Associations InterPARES - International Research on Permanent Authentic Records in Electronic Systems JISC - Joint Information Systems Committee KNAW - Netherlands Academy of Arts and Sciences LOC – Library of Congress MIT - Massachusetts Institute of Technology METS - Metadata Encoding and Transmission Standard MoReq - Modular Requirements for Records Systems (até 2010 era Model Requirements for the Management of Electronic Records) NAA - National Archives of Australia NARA - National Archives and Records Administration NASA - National Aeronautics and Space Administration NEDLIB - Networked European Deposit Library NIST - National Institute of Standards and Technology NLA - National Library of Australia NWO - Netherlands Organization for Scientific Research OAIS - Open Archival Information System OCLC - Online Computer Library Center OD – Objecto Digital PDI - Preservation Description Information 2 PPD – Plano de Preservação Digital PREMIS - Preservation Metadata: Implementation Strategies PRO - Public Record Office RAMP - Records and Archives Management Programme RCAAP - Repositório Científico de Acesso Aberto de Portugal RLG - Research Libraries Group SI – Sistema da Informação SIADE - Sistemas de Informação de Arquivo e Documentos Electrónicos SIG - Sistemas de Informação Geográfica SIP - Submission Information Package SPARC - Scholarly Publishing & Academic Resources Coalition TI – Tecnologia da Informação UDFR - Unified Digital Format Registry UML - Unified Modeling Language UNESCO - United Nations Educational, Scientific and Cultural Organization UTF - Unicode Transformation Format UVC - Universal Virtual Computer XML - eXtensible Markup Language 3 1 - Introdução “Unfortunately, we cannot guarantee the continued preservation and accessibility of digital information generated in this context of rapid technological advances. Despite our information technology investments, there is a critical, cumulative weakness in our information infrastructure. Long-term preservation of digital information is plagued by short media life, obsolete hardware and software, slow read times of old media, and defunct Web sites. Indeed, the majority of products and services on the market today did not exist five years ago. More importantly, we lack proven methods to ensure that the information will continue to exist, that we will be able to access this information using the available technology tools, or that any accessible information is authentic and reliable.”1 Podemos constatar que os principais problemas decorrentes da produção, utilização e manutenção de informação electrónica passam pela ausência de percepção social/organizacional ou, pelo contrário, pelo excessivo sentido de individualização, perda de informação operacional, perda de informação-memória e perda de valor evidencial, o que compromete a responsabilização de conduta e actividades. Outros problemas passam pela dificuldade de gestão dessa informação, a nível do seu armazenamento, recuperação e localização, identificação e controlo. Do ponto de vista técnico, os problemas surgem em termos de obsolescência tecnológica, do hardware, do software, dos formatos, dos suportes de armazenamento, dos danos e desgaste físicos, e ainda do fenómeno do bit rot, ou corrupção de dados no suporte2. Estes problemas levam à ilegibilidade, impossibilidade de acesso e mesmo desaparecimento físico dos objectos digitais. Sabendo que esta informação é operacionalmente necessária durante períodos mais ou menos longos, torna-se necessário empreender acções para manter a sua legibilidade. Verifica-se no caso dos formatos, que um formato de ficheiro pode ser ultrapassado por outro ou tornar-se mais complexo, que o formato não “pega” (não é utilizado pela possível comunidade de interesse) ou as empresas não criam software compatível, ou que o formato falha, estagna, ou já não é compatível com os sistemas actuais. No caso do software, este pode falhar comercialmente ou inclusivamente a empresa que o produz ser adquirida por um competidor que o retira do mercado. Entre os elementos que afectam os suportes e o hardware contam-se a instabilidade do material, as condições ambientais de armazenamento, os efeitos de manuseamento e utilização, desastres naturais, as falhas infra-estruturais e a manutenção inadequada. A obsolescência do hardware é uma constante desta indústria devido aos avanços tecnológicos a nível de velocidade do processador, densidade dos chips de memória, capacidade dos periféricos de armazenamento, velocidade de processamento de imagem e velocidade de transmissão. Tais alterações levam à rápida substituição dos suportes, não só devido à maior rapidez, capacidade e produtividade disponíveis, mas também devido ao cada vez maior número de funções oferecidas. Elementos como a diminuição do tamanho físico, o 1 2 CHEN, Su-Shing - The paradox of digital preservation. p. 1. Cft. SALTER, Jim - Bitrot and atomic COWs; Wikipedia contributors – Bit rot; e RAYMOND, Eric - Bit rot. 5 aumento da capacidade e diminuição do custo por unidade de armazenamento, as tendências em termos de fragilidade, estabilidade, segurança e duração antes da obsolescência, levam a novas e melhores aplicações de software, que aumentam a probabilidade de obsolescência do equipamento anterior3. Enquanto os fabricantes de todas estas tecnologias competem, emergem, unem-se ou desaparecem, torna-se cada vez mais difícil a manutenção dos conteúdos digitais ao longo do tempo. Num mundo em rápido desenvolvimento tecnológico terão as instituições responsáveis pelo património digital a capacidade de assegurar a sua preservação, fornecer o acesso e permitir a utilização da documentação a longo prazo? Conseguirão estas instituições assegurar aos documentos digitais as mesmas características de fidedignidade, integridade e autenticidade face aos tradicionais documentos em papel? Poderão os autores e utilizadores dos repositórios digitais, as entidades financiadoras de projectos digitais, e a comunidade em geral, confiar na capacidade das instituições para gerir e preservar a documentação digital? Sendo estas características abordadas ao longo deste trabalho, impõe-se a definição de cada uma delas. Considera-se assim que, a integridade de um documento de arquivo refere-se a este permanecer completo e inalterado. No caso dos objectos digitais, esta inalterabilidade é percepcionada como inexistência de modificações não intencionais (humanas ou técnicas). A autenticidade diz respeito à garantia de prova de que o documento de arquivo é aquilo que pretende ser, de ter sido produzido ou enviado pelo alegado produtor ou remetente, e de ter sido produzido ou enviado no alegado momento de produção ou envio. Tal implica a possibilidade de confirmar a sua origem ou proveniência e percurso. A usabilidade ou disponibilidade prende-se com o facto de o documento ser utilizável, ou seja, que pode ser localizado, recuperado, apresentado e interpretado. A fidedignidade (ou confiabilidade) é a propriedade do documento que é digno de crédito enquanto representação completa e fiel das transacções, actividades ou factos que atesta. Esta característica está intimamente ligada com a confiança, assunto que será abordado mais profundamente em capítulo próprio.4 Estas são algumas questões que se têm vindo a colocar nas últimas três décadas, desde que várias organizações assumiram definitivamente a sua adesão aos formatos digitais para a produção, gestão e guarda dos seus documentos, sejam eles nado-digitais ou digitalizados. A questão da confiança é central quando se trata de informação em suporte digital, e a tentativa de responder a questões como as anteriores trouxe para o debate na comunidade científica a necessidade de assegurar a confiabilidade dos repositórios digitais. Pretende-se neste trabalho:  demonstrar que os repositórios digitais não são apenas um veículo de transmissão de informação, mas que também são uma solução de sistematização de preservação digital;  demonstrar que a certificação pode ser uma solução possível para garantir a confiabilidade dos repositórios digitais; 3 BARBEDO, Francisco; CORUJO, Luis; SANT’ANA, Mário – Recomendações para a produção de planos de preservação digital, p. 29-31. 4 NP 4438-1:2005, Informação e Documentação - Gestão de documentos de arquivo, p. 14-15. 6  apresentar a comparação entre alguns documentos normalizadores com critérios que pretendem ser veículo de certificação (TRAC; ISO 16363:2012; NESTOR);  demonstrar qual o grau de cumprimento do RODA (Repositório de Objectos Digitais Autênticos) perante os critérios desses documentos. A abordagem perspectivada para este trabalho foi de carácter essencialmente diacrónico, e do geral para o particular. Pretende-se assim inferir dos desenvolvimentos registados ao longo das últimas décadas na área da Preservação Digital, a demonstração que os repositórios digitais confiáveis são o corolário sistémico que pretende dar resposta ao conjunto de problemas cada vez mais complexos referentes à ingestão, gestão, manutenção, preservação e garantia de acesso à informação digital a longo prazo. Por esse motivo se considera igualmente que a apresentação que parte da conservação em geral, passa pelas problemáticas da preservação digital, pelos repositórios digitais, e dentro destes o Modelo de Referência OAIS, como caminho e aprofundamento para a certificação de repositórios que se pretendem confiáveis, no âmbito dos quais surge o RODA, sistema em constante evolução, desenvolvimento e actualização como forma de cumprimento dos requisitos de certificação pelos quais é avaliado. Assim, a organização deste trabalho está configurada da seguinte forma: considerando o primeiro capítulo esta Introdução, o segundo capítulo aborda a problemática da preservação no âmbito digital e o objecto em que se foca a preservação digital. Nesse âmbito apresentam-se as estratégias e o quadro teórico de referência de preservação de objectos digitais, e finalmente com o Modelo de Informação de Preservação Digital. Este capítulo permite introduzir a preservação de objectos digitais, de forma que no terceiro capítulo se demonstre que a preservação sistematizada desses objectos só é verdadeiramente passível em repositórios digitais. Nesse sentido aborda-se a questão do conceito e definição dos repositórios. Sendo o termo repositório algo vago e, numa altura que estrangeiros avaliam a produção científica portuguesa (nalguns casos referentes a disciplinas do saber com características específicas, como é o exemplo da História), tendo por base critérios mais ligados à quantidade do que à qualidade das publicações, os repositórios de artigos científicos assumem real importância, devendo haver cuidado no que diz respeito aos atributos de descrição, usados para referenciação dos artigos científicos, como forma de atenuar de certa forma o problema de publicar sem ser em inglês. Este capítulo refere-se aos repositórios digitais, aos âmbitos de utilização, como repositórios/arquivos digitais (não deixando de lado a questão do Acesso Aberto), e as particularidades dos repositórios institucionais e temáticos e ainda das Bibliotecas Digitais. O quarto capítulo apresenta o Modelo de Referência OAIS, com os seus modelos de Ambiente Externo, de Informação, e o Funcional. De igual forma abordam-se áreas para desenvolvimento de normas relacionadas com o modelo OAIS, algumas das quais intimamente ligadas à Certificação, questão esta que é aprofundada no quinto capítulo relativo à Confiança. Este capítulo aborda conceptualmente a confiança, particularmente quando derivada de documentos normalizadores, com atributos, requisitos, critérios e métricas para auditoria, avaliação, planeamento e certificação de repositórios, sem esquecer o ponto de vista dos utilizadores dos repositórios digitais, na medida em que tais documentos devem ser reconhecidos pela(s) comunidade(s) de produtores e utilizadores. Factores como definição de estratégias e análise de riscos, monitorização, auditoria e certificação são aspectos que promovem a confiança, e que fazem parte da preservação digital, e, logo, dos repositórios digitais. Um dos possíveis cúmulos da 7 confiança nos repositórios digitais seria a gestão e manutenção a médio-longo prazo das propriedades arquivísticas de documentos de arquivo com assinatura electrónica. O sexto capítulo aborda o RODA, falando da sua origem, evolução e elementos constituintes. Este repositório digital teve como base o modelo de referência OAIS (abordado no quarto capítulo) e foi alvo de avaliação por parte de um documento normalizador para auditoria e certificação (TRAC), abordado no quinto capítulo. O conteúdo destes capítulos vai permitir apresentar uma comparação entre três documentos para certificação (TRAC, ISO 16363:2012 e NESTOR), e será acompanhada de um quadro comparativo anexo e que foi produzido no âmbito deste trabalho. Ainda neste capítulo proceder-se-á à apresentação dos resultados da avaliação do RODA com base nestes mesmos documentos. 8 2 - Preservação Digital O assustador texto de Terry Kuny A Digital Dark Ages? Challenges in the Preservation of Electronic Information5, de 1997, representa uma tomada de consciência, no início da eufórica expansão da Internet, símbolo da preponderância que as tecnologias electrónicas da informação e comunicação estavam a assumir nos vários domínios da vida das pessoas, das organizações, da sociedade. Contra a sedutora utopia anunciada pelos evangelistas e gurus informáticos, Kuny anunciava sensatamente que era necessário estudar o impacto destas tecnologias na Sociedade e garantir a preservação da História e do património criado nesta Era, sob o risco de se perder a sua memória. Afirmando que não existiam soluções sustentadas para os problemas da preservação digital, o autor apontava linhas de acção a seguir e que especialistas e profissionais estavam habilitados para garantir que não entraríamos numa Idade das Trevas Digital. Precisamos então de saber o que significa preservação digital, qual o seu objecto, e de que forma opera sobre esse objecto. Conway afirma que “simply defining what preservation means in the digital imaging environment is a challenge6”. O conceito de preservação digital requer assim uma análise dos termos utilizados à luz da área científica. Esta abordagem assentará em normas e bibliografia indicada ao longo do texto. Não se insere no âmbito deste trabalho a pretensão de analisar a evolução dos modelos teóricos nem dos paradigmas ligados à preservação e conservação, uma vez que se considera que esse estudo, por si só, requer um trabalho dedicado e autónomo. Preservação … O conceito de Preservação é utilizado muitas vezes de maneira indiscriminada, gerando-se confusão com outros termos como Conservação e Restauro, sendo necessário a distinção destes três termos. Azevedo Pinto refere que, “Relativamente à definição de preservação e conservação, é um facto a associação destes conceitos, sobretudo no último quartel do século XX.”7 De acordo com Maria Luísa Cabral: “Durante muito tempo, preservação significava o restauro das espécies correspondendo, portanto, a uma intervenção pontual, desarticulada do contexto mais geral, que tinha em vista a prossecução dos objectivos da biblioteca que são fundamentalmente facultar o acesso à informação(...)”8 Verifica-se então que o tratamento era feito erraticamente e sem qualquer planeamento, sugerindo uma postura de “apagar os pequenos fogos diários” sem qualquer estratégia de 5 KUNY, Terry - A digital dark ages?, 1999. CONWAY, Paul - Preservation in the digital world, 1996. 7 PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 33. 8 CABRAL, Maria Luísa – Amanhã é sempre longe de mais, p. 17. 6 9 fundo. Adicionalmente, a conservação impunha-se à preservação, sendo mesmo sua parte integrante, como se atesta no Traditional restoration techniques: a RAMP study9: “There are two types of action in the conservation of materials: (a) Preventing deterioration (preservation) (b) Repairing damage (restoration)” A publicação portuguesa, em 1992, dos Princípios para a Preservação e Conservação de Espécies Bibliográficas da IFLA10 (original de 1986) já indica que a “Preservação engloba todos os aspectos financeiros e de gestão incluindo a armazenagem em todos os aspectos, questões de pessoal, política, técnica e métodos envolvidos na preservação de espécies bibliográficas e a informação que elas contenham”; a Conservação “engloba políticas e práticas específicas necessárias à protecção das espécies bibliográficas relativamente à deterioração, destruição e envelhecimento, incluindo os métodos e as técnicas propostas pelo pessoal técnico”; e o Restauro “diz respeito às técnicas e critérios utilizados pelo pessoal técnico envolvido no processo de tratamento de espécies bibliográficas, deterioradas pelo tempo, uso ou outros factores”. Constata-se assim, e de acordo com Maria Luísa Cabral, que “(...) Aos poucos, foi-se compreendendo que esta intervenção, espécie a espécie, constituía uma corrida contra o tempo, corrida que os técnicos de biblioteca perdiam sempre. (...)”11. Estes termos começam assim a ser tratados como problemáticas independentes mas que fazem parte de uma política específica da própria biblioteca e das preocupações de quem as gere. Analogamente, no Dicionário de Terminologia Arquivística, publicação portuguesa de 1993 que visava ser o equivalente português do Dictionary of Archival Terminology do Conselho Internacional de Arquivos (ICA) de 1984 e 1988, a Conservação surge com duas definições: “Função do arquivo que consiste em assegurar a custódia e preservação dos arquivos, e como Conjunto de medidas de intervenção sistemática e directa nos documentos com o objectivo de impedir a sua degradação, sem alterar as características físicas dos suportes”12. Refere também que Preservação é o “conjunto de medidas de gestão tendentes a neutralizar potenciais factores de degradação dos documentos”13, e que Restauro é o conjunto de técnicas utilizadas para a recuperação dos suportes e/ou eliminação dos danos causado na documentação pelo tempo, uso ou outros factores. Implica intervenção e tratamento do documento. No âmbito destes dois documentos, Manuela Azevedo Pinto na sua obra PRESERVMAP, de 2009, identifica uma sintonia nas definições do termo Preservação14, no que se refere à associação do termo gestão à preservação. No quadro normativo nacional, já no século XXI, são dignas de menção a norma de Terminologia Arquivística NP 404115, de 2005, e a Norma de Gestão de Documentos de 9 VIÑAS, Vicente; VIÑAS, Rute - Traditional restoration techniques, p. 2. DUREAU, J. M.; CLEMENTS, D. W. G. – Princípios para a preservação e conservação de espécies bibliográficas, 1992. 11 CABRAL, Maria Luísa – Amanhã é sempre longe de mais, p. 17. 12 ALVES, Ivone [et al.] – Dicionário de terminologia arquivística, p. 23-24. 13 ALVES, Ivone [et al.] – Dicionário de terminologia arquivística, p. 76. 14 PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 31. 10 10 Arquivos NP 4438, de 2005, correspondente à norma ISO 15489:200116. A NP 4041 apresenta a Preservação como sendo a “aplicação de medidas e procedimentos tendentes a prevenir a degradação física dos documentos e a garantir a sua segurança contra acidentes e intrusões”17, o que é corroborado pela definição de preservação fornecida pela NP 4438, ou seja, “processos e operações necessárias para assegurar a sobrevivência de documentos autênticos através do tempo”18. No que se refere à Conservação, a NP 4041, define-a como “função primordial do serviço de arquivo que tem por objectivo assegurar a manutenção das características essenciais dos arquivos/documentos de modo a garantir a sua eficácia através do tempo. Exerce-se mediante recurso à avaliação, recolha, custódia, preservação, conservação física, restauro e tratamento arquivístico”19. A mesma Norma indica que o Restauro é o “conjunto de técnicas utilizadas na recuperação e/ou consolidação dos suportes. Implica intervenção e tratamento do documento”20. A publicação do Dicionário do Livro em 2008 apresenta a definição de Conservação como o “conjunto de técnicas que, através de materiais de boa qualidade, têm como finalidade preservar o objecto”21, e liga-o à preservação e protecção. Esta definição é aprofundada na definição de Conservação de Documentos, “nome dado ao conjunto de processos que visam a estabilização mecânica e química dos materiais constituintes do documento gráfico. Conjunto de medidas destinadas a manter em boas condições um acervo bibliográfico ou outro, com vista a garantir que se mantenha a sua forma original. Acções iniciais para conter o processo de degradação de um documento; centram-se em operações de protecção ao documento, como limpeza e manutenção de condições ideias de armazenamento que contribuam para garantir a sua integridade (…)”22. O mesmo Dicionário definiu preservação como a “função de providenciar cuidados adequados à protecção e manutenção do acervo bibliográfico e documental de qualquer espécie, com vista a manter a sua forma original. Medidas colectivas e individuais tomadas no respeita à reparação, restauro, protecção e manutenção do património bibliográfico”23. Por sua vez o Restauro é definido como uma “intervenção levada a cabo sobre um bem cultural degradado ou danificado, determinada pela necessidade de conservar a informação histórica de que ele é veículo e de lhe restituir a funcionalidade no todo ou em parte. No caso dos materiais gráficos, consiste em eliminar de um livro ou documento os estragos causados pelo tempo, manuseamento e incúria do homem; é um trabalho complexo e delicado, que vai do simples desmanchar, lavar, desacidificar, remendar, reforçar o papel e fortalecer as folhas ao refazer da encadernação; o respeito crescente dos bibliófilos pelo estado original da obra, torna-os cada vez mais reticentes em relação à reparação dos livros antigos e prudentes na aquisição de espécies restauradas, cujo resultado final não teve êxito”24. Remete ainda para a Substituição de partes danificadas, para a Reconstrução e Reparação. 15 NP 4041:2005, Informação e Documentação - Terminologia arquivística: Conceitos básicos. ISO 15489-1: 2001, Information and documentation - Records management. 17 NP 4041:2005, Informação e Documentação - Terminologia arquivística: Conceitos básicos, p. 14. 18 NP 4438-1:2005, Informação e Documentação - Gestão de documentos de arquivo, p. 10. 19 NP 4041:2005, Informação e Documentação - Terminologia arquivística: Conceitos básicos, p. 11. 20 NP 4041:2005, Informação e Documentação - Terminologia arquivística: Conceitos básicos, p. 14. 21 FARIA, Maria Isabel; PERICÃO, Maria da Graça - Dicionário do Livro, p. 303. 22 FARIA, Maria Isabel; PERICÃO, Maria da Graça - Dicionário do Livro, p. 303-304. 23 FARIA, Maria Isabel; PERICÃO, Maria da Graça - Dicionário do Livro, p. 997. 24 FARIA, Maria Isabel; PERICÃO, Maria da Graça - Dicionário do Livro, p. 1081. 16 11 Nesta panorâmica podemos ver a evolução terminológica, tentando-se fazer uma destrinça conceptual. Para, Manuela Azevedo Pinto estas definições revelam um “enfoque na custódia, na protecção física, (…) na manutenção da forma original, necessidade de controlo ambiental/ou tratamento físico e/ou químico25”, sendo ainda necessário distinguir claramente o que é preservação e o que é conservação e a sua relação, uma vez que “(...) esta relação caracterizou-se pela inexistência de contornos claros e objectivos”26. Neste sentido a autora avança com uma definição de Preservação, que considera ser: “intrínseca à função de Gestão, seja a nível institucional, seja a nível intermédio (…), devendo ser pensada no longo prazo e em termos de politicas, planos e programas, recursos e estrutura orgânica/funcional que os suporte, tendo, consequentemente, implicações quer na fixação da Missão da organização, quer nos objectivos (estratégicos e operacionais), quer nas metas fixadas, quer, ainda, nas acções/actividades e projectos planeados para os efectivar.”27 Ainda segundo a autora, após definida a estratégia de preservação, será a sua concretização ou operacionalização que vai contar com os contributos do domínio da componente técnica, da Conservação, com a aplicação de procedimentos, medidas e técnicas de protecção de cariz mais preventivo, e o Restauro, que, de forma complementar, lidaria com o tratamento e recuperação. Esta definição vai de encontro ao estipulado por Conway: “Preservation is the acquisition, organization, and distribution of resources to prevent further deterioration or renew the usability of selected groups of materials. The essence of preservation management is resource allocation (…) Preservation management includes an ongoing, iterative process of planning and implementing prevention activities (e.g., maintaining a stable, safe, and secure environment, ensuring disaster preparedness, and building a basic collectionlevel maintenance program) and renewal activities (e.g., undertaking conservation treatments, replacing the content of library materials, or reformatting them on microfilm).”28 Cremos que, independentemente de qualquer modelo empírico e/ou teórico ou de qualquer paradigma, estas definições especificam declaramente os termos em apreço. ... Digital Por seu lado, o termo digital, assumido como adjectivo da preservação, afigura-se como de difícil concordância numa definição única por parte dos cientistas da computação. De acordo com Rothenberg, normalmente diz respeito a um conjunto de dispositivos de transmissão, processamento ou armazenamento de sinais digitais que usam valores discretos (descontínuos). No contexto em que nos apresentamos, geralmente significa qualquer meio de representação de sequências de valores simbólicos discretos - cada valor tem dois ou mais estados inequivocamente distintos - para que estas sequências possam, pelo menos em princípio, ser acedidos, manipulados, copiados, armazenados, e integralmente transmitidos 25 PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 32. PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 33. 27 PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 34. 28 CONWAY, Paul - Preservation in the digital world, 1996. 26 12 por meios mecânicos com elevado grau de fiabilidade.29 Pelo contrário, os sistemas nãodigitais (ou analógicos) utilizam um intervalo contínuo de valores para representarem informação. Embora as representações digitais sejam discretas, a informação representada pode ser discreta, como números, letras, ou ícones, ou contínua, como sons, imagens, outras medidas de sistemas contínuos.30 Outros exemplos de sistemas digitais são, para além dos sistemas binários electrónicos que utilizam na computação e na electrónica, por exemplo, o ábaco, os faróis, os semáforos, o código de morse, o Braille… Bannat-Berger dos Archives de France, afirma que o domínio do digital se caracteriza por: “Évolutions d’une rapidité spectaculaire, capacité de traitement en constante augmentation, progression géométrique des capacités de stockage et de transport, obsolescence des technologies.”31 Esta definição não nos traz muito conforto para entender o que é a preservação digital, uma vez que parece ser oposta à pretensão do que a preservação se propõe fazer, mas serve de ponto de partida para encontrar a resposta para essa questão na literatura. Encontramos tanto a nível internacional como nacional um conjunto de definições: Margaret Hedstrom [1997] - planeamento, alocação de recursos e aplicação de métodos e tecnologias de preservação necessárias para garantir que a informação digital de valor, seja esta nadodigital ou produto de digitalização, se mantêm continuadamente acessível e utilizável, sendo que com o uso do termo continuadamente pretende afastar-se do idealismo e absolutismo do termo "permanente".32 BEAGRIE, Neil & GREENSTEIN, Daniel (1998) - processo distribuído que inclui um conjunto de diferentes partes interessadas que lidam com recursos digitais em determinadas fases do seu ciclo de vida. Para aumentar as probabilidades da preservação digital e reduzir custos, as diferentes partes interessadas necessitam de estar mais conscientes de como o seu envolvimento com um recurso digital influencia o seu ciclo de vida.33 CEDARS - RUSSEL, Kelly & SERGEANT, Derek (1999) - armazenamento, manutenção e acesso a longo prazo de um objecto digital, normalmente como consequência da aplicação de uma ou mais estratégias de preservação, incluindo a preservação de tecnologia, a emulação, ou a migração de dados.34 Rothenberg (2000) - a dificuldade da definição de uma estratégia de preservação viável prende-se em parte com a nossa falha de compreensão e avaliação das questões de autenticidade à volta das entidades informacionais digitais e a implicação dessas questões em possíveis soluções técnicas para o problema da preservação digital. O impacto da 29 ROTHENBERG, Jeff - Preserving authentic digital information, p. 52. TOCCI, Ronald; WIDMER, Neal; MOSS, Gregory - Digital systems: principles and applications, 2007. 31 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 23. 32 HEDSTROM, Margaret - Digital preservation: a time bomb for digital libraries. 33 BEAGRIE, Neil; GREENSTEIN, Daniel – A strategic policy for creating and preserving digital collections, p. 5. 34 RUSSEL, Kelly; SERGEANT, Derek - The CEDARS project : implementing a model for distributed digital archives, 1999. 30 13 autenticidade na preservação manifesta-se em termos de usabilidade, nomeadamente quando uma entidade informacional preservada só pode ser usada nos âmbitos pretendidos ou requeridos somente se a sua autenticidade estiver preservada. Não existe uma definição de preservação digital que garanta a salvaguarda de todas as características de tais identidades.35 APBAD - Manifesto para a Preservação Digital, Cecília Henriques (2002) – “capacidade do objecto preservado cumprir com as suas funções para que foi produzido, no âmbito da sua utilização, ou seja, a manutenção da autenticidade e acessibilidade do e ao objecto preservado, o que implica compromissos de investimento durante todo o ciclo de vida do documento, caso contrário redundará em perdas irremediáveis e inutilização do esforço anterior.”36 IFLA - H. Hofman (2002) - pode ser descrita de duas formas válidas, necessárias e complementares, porque identificam os aspectos ou requisitos a considerar na preservação de objectos digitais: uma definição abrangente que leva em conta os aspectos intelectuais e que pretende assegurar a autenticidade, usabilidade e acessibilidade dos objectos digitais durante o tempo necessário; e outra mais específica e referente a aspectos técnicos com o intuito de garantir a sobrevivência tecnológica dos objectos e informação digitais enquanto forem necessários.37 Research Libraries Group & Online Computer Library Center, Report (RLG/OCLC) Beagrie, M. Bellinger, R. Dale, M. Doerr, M. Hedstrom, M.Jones, A. Kenney, C. Lupovici, K. Russell, C. Webb and D. Woodyard, (2002) - gestão de actividades necessárias para garantir tanto a manutenção a longo prazo de dados digitais como o acesso continuado dos seus conteúdos. Se a discussão se refere a um destes em específico, deve utilizar um termo mais preciso.38 UNESCO - Webb, C. (2003) - Processos ligados à manutenção de informação e outros tipos de património digital. Neste âmbito não se refere a técnicas de cópia ou digitalização de itens não-digitais, mesmo que seja para fins de preservação. No entanto o produto destas digitalizações pode constituir-se em património a preservar.39 Maria Manuela Gomes de Azevedo Pinto (2005) – “garantir os requisitos e objectivos referentes à produção, tendo em conta as várias partes interessadas e implicações de vária ordem que dela decorrem.”40 Miguel Ferreira (2006) – “capacidade de garantir a acessibilidade e autenticidade suficiente da informação digital para que possa ser interpretada num plataforma tecnológica diferente daquela em que foi criada. Trata-se da actividade responsável pela garantia da comunicação entre emissor e receptor através do espaço e do tempo.”41 35 ROTHENBERG, Jeff - Preserving authentic digital information, p. 54-55. HENRIQUES, Cecília - Preservação digital: uma perspectiva arquivística, p. 79-81. 37 HOFMAN, Hans - Can bits and bytes be authentic? preserving the authenticity of digital objects, p. 1. 38 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 3. 39 WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage, p. 20. 40 PINTO, Maria Manuela Gomes de Azevedo – Do «efémero» ao «sistema de informação», p. 55. 41 FERREIRA, Miguel - Introdução à preservação digital, p. 24. 36 14 Digital Curation Centre (DCC) e Digital Preservation Europe (DPE) (2007) - define-se como um exercício de gestão de risco com o objectivo de converter a incerteza da manutenção da usabilidade de objectos digitais autênticos em riscos quantificáveis.42 ALA (2007 e 2009) - combina políticas, estratégias e acções que garantam a apresentação mais precisa do conteúdo autêntico ao longo do tempo, independentemente dos problemas de corrupção dos ficheiros, falha de suportes e avanço tecnológico, aplicando-se a conteúdo nadodigital ou digitalizado.43 Digital Preservation Coalition - BEAGRIE, Neil; JONES, Maggie (2008) - todas as acções necessárias para a manutenção do acesso aos materiais digitais para além dos limites da falha de suportes ou avanço tecnológico. Esses materiais podem ser documentos de arquivo produzidos no âmbito das actividades de negócio da organização, materiais nadodigitais criados para um fim específico, ou resultados de projectos de digitalização.44 Faria & Pericão (2008) - utiliza a definição de Webb que considera como “o conjunto de actividades ou processos responsáveis pela garantia de acesso continuado a longo prazo à informação e património digitais, consistindo na capacidade de garantir a acessibilidade suficiente da informação, para que possa ser interpretada no futuro numa plataforma tecnológica diferente da que lhe deu origem.”45 Rafael António (2008) – “política, serviços e práticas que pretendem garantir o acesso fidedigno a longo prazo dos recursos digitais.”46 InterPARES 2 (2007?) - o processo específico de manutenção de materiais digitais durante e ao longo de várias gerações de tecnologia ao longo do tempo, independentemente de onde se encontram.47 Interpares 3 (2011?) - o processo específico de manutenção de materiais digitais durante e ao longo de várias gerações de tecnologia ao longo do tempo, independentemente de onde se encontram. Conjunto de acções de gestão e técnicas necessárias para ultrapassar as alterações tecnológicas e a fragilidade dos suportes garantindo o acesso e interpretação dos documentos digitais durante o tempo considerado necessário.48 DGARQ (2011) - e finalmente a definição apresentada no documento do qual partilhamos a autoria, segundo o qual a preservação digital assume três vectores: referentes a conjuntos de actividades cuja finalidade é, por um lado, aumentar a vida útil da informação de arquivo (iARQ), salvaguardando a utilização operacional e protegendo-os das falhas de suportes, perda física e obsolescência tecnológica, por outro, promover a acessibilidade continuada aos 42 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 20. MARYNIAK, Cathy [et al.] - Definitions of digital preservation, p. 2. 44 BEAGRIE, Neil; JONES, Maggie – Preservation management of digital materials: a handbook. 45 FARIA, Maria Isabel; PERICÃO, Maria da Graça - Dicionário do livro, p. 997. 46 ANTÓNIO, Júlio - O sistema de gestão documental, p. 187. 47 - InterPARES 2 Project Glossary, p. 18. 48 - InterPARES 3 Project Glossary. 43 15 conteúdos, e ainda assistir na preservação do conteúdo intelectual, forma, estilo, aparência e funcionalidade.49 A análise destas definições permite verificar que a maioria dos autores identifica a necessidade de um plano de gestão sistematizado, com processos específicos, e que inclua a definição de políticas, gestão de recursos, estratégias de aplicação de métodos e actividades definidas, com o objectivo de manter a autenticidade, usabilidade, e garantir acessibilidade fidedigna e continuidade da informação e/ou património digital, independentemente da evolução tecnológica, falhas de suporte, corrupção de ficheiros, tendo em conta os objectivos das partes interessadas e as implicações administrativas, legais, políticas e económico-financeiras. Tal requer que as partes interessadas, os diversos atores, desde o emissor até ao receptor, adquiram consciência de como o seu envolvimento, por muito particular que seja, com os objectos digitais se ramifica ao longo do seu ciclo de vida, devendo esse envolvimento implicar um compromisso de investimento continuado que aumente as perspectivas da preservação e a redução dos seus custos. Para além disso estas definições:  consideram como digna de preservação não só os materiais nado-digitais mas também os produtos de projectos de digitalização, estabelecendo o objecto da preservação digital;  referem os objectivos que se pretendem atingir com a preservação digital, que indicamos como manter a autenticidade, usabilidade, e garantir acessibilidade fidedigna e continuidade da informação e/ou património digital, tendo em conta os objectivos das partes interessadas e as implicações administrativas, legais, políticas e económicofinanceiras;  identificam as razões na origem da necessidade de promover a preservação digital, como riscos decorrentes da evolução tecnológica, falhas de suporte, corrupção de ficheiros;  inferem a necessidade de identificar os diversos envolvidos na comunidade de interesse e o seu papel no âmbito do ciclo de vida e, por consequência, no âmbito da preservação digital. Ainda no que se refere a estas definições, elas evidenciam o que Chen já referia em 2001: “Traditionally, preserving things meant keeping them unchanged; however, our digital environment has fundamentally changed our concept of preservation requirements. If we hold on to digital information without modifications, accessing the information will become increasingly more difficult, if not impossible. Even if we could find a physical medium to contain unaltered digital data permanently, formats for recording the information would change and the hardware and software needed to recover the information would become obsolete.”50 Thibodeau, em 2002, referia mesmo que: 49 BARBEDO, Francisco; CORUJO, Luis; SANT’ANA, Mário – Recomendações para a produção de planos de preservação digital, p. 8. 50 CHEN, Su-Shing - The paradox of digital preservation, p. 5. 16 “Digital preservation is not a simple process of preserving physical objects but one of preserving the ability to reproduce the objects. The process of digital preservation, then, is inseparable from accessing the object. You cannot prove that you have preserved the object until you have re-created it in some form that is appropriate for human use or for computer system applications.”51 Tal permite-nos corroborar a afirmação feita em 2011 por Carla Ferreira: “o facto de serem necessárias plataformas tecnológicas diferentes daquelas utilizadas no momento da criação do documento original. Quer isto dizer que o objectivo da preservação digital não passa tanto pela preservação do suporte físico (como acontece com a preservação tradicional), mas sim por garantir que a informação nele contida permaneça acessível e autêntica ao longo do tempo.” 52 Existem ainda dois elementos a ter conta, em relação a estas definições: em primeiro lugar oferecem uma gama diversa de termos do que consideram material a preservar; em segundo lugar, algumas definições incluem estratégias específicas para a preservação desse material. O Objecto da Preservação Digital Definições e Características No que concerne à existência dos termos, documento, digital information, contents, records, digital resources, digital object, bytestream, digital materials, ela reflecte a afirmação de Azevedo Pinto, referente ao enfoque na área de estudo e investigação que é a preservação digital, como consciencialização do desafio digital: “Aos termos documento/livro sucedem-se agora termos como digital materials, digital object e digital resources.”53 Em 1997 o ICA publica o Estudo 8: Guide for Managing electronic records from an archival perspective54 em que define um documento de arquivo como informação registada produzida ou recebida no início, condução ou conclusão de uma actividade institucional ou individual e que compreende conteúdo, contexto e estrutura suficientes para fornecer prova dessa actividade independentemente do formato ou suporte. A característica distintiva dos documentos de arquivo electrónicos é que o conteúdo é registado num suporte e em símbolos (dígitos binários) cuja leitura e compreensão requer um computador ou tecnologia similar. 51 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years, p. 12. 52 FERREIRA, Carla - Preservação da informação digital, p. 15. 53 PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 121. 54 ICA Committee on Electronic Records - Guide for managing electronic records from an archival perspective. 17 Nesse mesmo ano o DLM Forum55 publica Guidelines on best practices for using electronic information, onde define “Electronic record A record where the information is recorded in a form that is suitable for retrieval, processing and communication by a digital computer.”56 Neste documento são também indicados os elementos constitutivos dos documentos electrónicos: o Conteúdo (que pode incluir vários tipos de dados, desde texto, tabelas, imagens, som, links), a Estrutura (lógica e física), o Contexto (que pode incluir metainformação técnica e descritiva), Apresentação (esta é cada vez mais abordada separadamente do documento de arquivo, na medida em que a informação é independente de como vai ser apresentada). É digno de nota que no âmbito do Programa SIADE (Sistemas de Informação de Arquivo e Documentos Electrónicos) que decorreu entre 1997 e 2002, fruto de um protocolo de cooperação entre Instituto dos Arquivos Nacionais/ Torre do Tombo (IAN/TT) e o Instituto de Informática (II), são produzidos dois documentos. As Recomendações para a Gestão de Documentos de Arquivo Electrónicos – 1:Contexto de Suporte, de 2000 já definem: “Documento de arquivo electrónico – Documento de arquivo produzido, transmitido e mantido com recurso a equipamentos electrónicos. Documento electrónico – Documento produzido, transmitido e mantido com recurso a equipamentos electrónicos.”57 Esta última definição é confirmada mais tarde, pelo Projecto InterPARES (International Research on Permanent Authentic Records in Electronic Systems)58, que lança em 2001 o The InterPares Glossary59, em que surgem definições como: “Digital component - A digital object that is part of an electronic record, or of a reproduced electronic record, or that contains one or more electronic records, or reproduced electronic records, and that requires specific methods for preservation. Electronic record - A record that is created (made or received and set aside) in electronic form.” 55 O DLM Forum foi fundado em 1994 pela Comissão Europeia. É uma associação que tem como membros os Arquivos Públicos e outros interessados em arquivos, documentos e gestão de informação de toda a União Europeia. A associação é aberta a todos. A sua sigla significava “Données Lisibles par Machine” até que, na sua Conferência de 2002 em Barcelona, se decidiu alterar o significado para 'Document Lifecycle Management’. Cft. DLM Forum - European Commission Introduction: The DLMForum, MoReq and the European Commission, p. 1-2. 56 UNIÃO EUROPEIA. Comissão - Guidelines on best practices for using electronic information, p. 50. 57 BARBEDO, Francisco; GOMES, Eugénia; HENRIQUES, Cecília - Recomendações para a gestão de documentos de arquivo electrónicos, p. 47. 58 O Projecto InterPARES desenrola-se entre 1999 e 2001 e estava focado em estabelecer requisitos de autenticidade de documentos inactivos produzidos e mantidos em grandes bases de dados e sistemas de gestão documental criados por organismos governamentais, cft. DURANTI, Luciana - The long-term preservation of authentic electronic records, 2001. 59 INTERPARES Project. Glossary Task Force - The InterPARES glossary, 2001. 18 Ainda no mesmo ano é publicado o MoReq (Model Requirements for the Management of Electronic Records) Specification, no âmbito do programa IDA (Interchange of Data between Administrations) da Comissão Europeia, através do DLM Forum e corrobora as definições anteriormente indicadas: “Electronic document - A document which is in electronic form. Note: use of the term electronic document is not limited to the text-based documents typically generated by word processors. It also includes e-mail messages, spreadsheets, graphics and images, HTML/XML documents, multimedia and compound documents, and other types of office document.(…) Electronic record - A record which is in electronic form. Note: it can be in electronic form as a result of having been created by application software or as a result of digitisation, e.g. by scanning paper or microform.”60 As fontes utilizadas pelo MoReq para estas definições são as Functional Requirements for Electronic Records Management Systems61 do Public Record Office, actual The National Archives. Em 2002 o Programa SIADE avança com as Recomendações para a gestão de documentos de arquivo electrónicos - 2. Modelo de requisitos para a gestão de arquivos electrónicos62. Este documento é a tradução e adaptação do MoReq à realidade portuguesa, incluindo as duas definições. Nesse mesmo ano Kenneth Thibodeau define objecto digital como um objecto de informação, de qualquer tipo de informação ou qualquer formato, que está expresso em forma digital. Para o autor, os componentes digitais de um objecto são os objectos lógicos e físicos necessários à reconstituição do objecto conceptual, e esses componentes não se limitam necessariamente aos objectos que contêm o conteúdo de um documento, na medida em que os componentes digitais podem conter dados necessários para a estrutura ou apresentação do objecto conceptual.63 A Digital Preservation Coalition (DPC), com o seu The Handbook64, que vai actualizando desde 2002, apresenta definições para alguns destes termos: “Digital Materials - A broad term encompassing digital surrogates created as a result of converting analogue materials to digital form (digitisation), and "born digital" for which there has never been and is never intended to be an analogue equivalent, and digital records.” “Digital Publications - "Born digital" objects which have been released for public access and either made available or distributed free of charge or for a fee. They 60 UNIÃO EUROPEIA. Comissão – MoReq specification, p. 104. A última versão disponível é de 2002. cft REINO UNIDO. Public Record Office - Requirements for electronic records management systems: 1: Functional Requirements. 62 HENRIQUES, Cecília [et al.] - Recomendações para a gestão de documentos de arquivo electrónicos: SIADE 2. Modelo de requisitos para a gestão de arquivos electrónicos. 63 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years, p. 6. 64 BEAGRIE, Neil ; JONES, Maggie – Preservation management of digital materials: a handbook. 61 19 may consist of networked publications, available over a communications network or physical format publications which are distributed on formats such as floppy or optical disks. They may also be either static or dynamic.” “Documentation - The information provided by a creator and the repository which provides enough information to establish provenance, history and context and to enable its use by others.” “Electronic Records - Records created digitally in the day-to-day business of the organisation and assigned formal status by the organisation. They may include for example, word processing documents, emails, databases, or intranet web pages.” A UNESCO lança em 2003 Charter on the Preservation of the Digital Heritage, e as Guidelines for the Preservation of Digital Heritage65 que definem Herança Digital como recursos únicos do conhecimento e expressão humanos, e que engloba recursos culturais, educacionais, científicos e administrativos, assim como informação técnica, legal, médica ou outra, criada digitalmente ou digitalizada a partir de recursos analógicos. Quando os recursos são nadodigitais não existe outro formato que não seja o objecto digital. Os materiais digitais incluem textos, bases de dados, imagem estática e em movimento, sons, gráficos, software e páginas web, dentro de uma grande e crescente variedade de formatos. São frequentemente efémeros e necessitam de produção, manutenção e gestão premeditados para serem conservados.66 O ICA (International Council on Archives) apresenta o seu estudo 16 Documentos de Arquivo Electrónicos: Manual para Arquivistas em 2005, cuja versão em português é uma tradução do original, adaptada à realidade portuguesa. A tradução foi efectuada em tempo recorde por um grupo de trabalho reunido pelo Instituto dos Arquivos Nacionais/Torre do Tombo, e do qual tivemos oportunidade de fazer parte. Nesse estudo, documento de arquivo é definido como “Informação registada, produzida ou recebida no início, condução ou conclusão de uma actividade de um individuo ou organização, e que compreende suficiente conteúdo, contexto e estrutura para fazer prova dessa actividade. Este amplo conceito cobre os vários tipos de documentos de arquivo produzidos em sistemas burocráticos. Os documentos de arquivo podem surgir sob formas e representações diferenciadas. Normalmente são representados como objectos de informação logicamente delimitados, ou seja, como objectos discretos. No entanto surgem cada vez mais documentos de arquivo sob a forma de objectos distribuídos, como sejam bases de dados relacionais e documentos compostos.” 67 No ano seguinte, tanto a IFLA (International Federation of Library Association), com Networking for digital preservation: current practice68 in 15 National Libraries, como o projecto InterPARES 269 com o The InterPARES 2 Project Glossary70, apresentam definições de digital objects, digital records, digital publications. 65 WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage, p. 13. ONU. UNESCO - Charter on the preservation of the digital heritage, p. 75. 67 ICA Committee on Electronic Records - Documentos de arquivo electrónicos: manual para arquivistas, p. 11. 68 VERHEUL, Ingeborg - Networking for digital preservation, p. 20-21. 69 O InterPARES 2 (2002 – 2007) concentrou-se em questões de confiabilidade, exactidão e autenticidade dos documentos de arquivo durante todo o seu ciclo de vida, e examinou os documentos de arquivo produzidos em ambientes dinâmicos no decurso de actividades artísticas, científicas e 66 20 Apresentamos finalmente os conceitos definidos pela DGARQ (Direcção-Geral de Arquivos) nas Recomendações para a Produção de Planos de Preservação Digital em 2008, do qual partilhamos a autoria, em que o Documento de Arquivo Electrónico surge como uma entidade lógica detentora de conteúdo, contexto e estrutura que lhe garanta ter um significado específico, sendo o Objecto Digital a sua componente física, podendo assim um Documento de Arquivo Electrónico, independentemente do formato, ser composto por um ou mais Objectos Digitais. Assim, somente é possível preservar um documento de arquivo electrónico se forem realizadas acções sobre os objectos digitais que o compõem.71 A estas definições acrescentam-se as considerações emanadas da versão de 2011 do mesmo documento, do qual também fomos autor, referentes ao sistema de informação, considerado como uma estrutura aplicacional especializada na contenção e gestão de dados e/ou informação. Neste documento são apresentadas dois tipos de representação que a informação de arquivo (iARQ) pode assumir, uma referente ao sistema de informação, mediado tecnologicamente e habitualmente ligado à aplicação de metodologias e ferramentas de bases de dados, estando aqui incluídos os sistemas multimédia como sistemas de informação geográfica (SIG), sistemas de webconference, etc., e outro tipo de representação relativo aos Documentos de Arquivo Electrónicos (DAE), que são objectos discretos legíveis de forma equivalente aos seus análogos em suporte analógico, e que são documentos produzidos com recurso a aplicações de produtividade (MS Office, CAD/CAM, etc.). De notar que os sistemas de informação podem conter ou gerir documentos de arquivo electrónico, como é o caso dos sistemas electrónicos de gestão documental, habitualmente constituídos por um sistema baseado em bases de dados que gere, manipula e referencia documentos produzidos e recebidos pela organização.72 Assim é consensual o resumo que Manuela Azevedo Pinto apresenta em 2009, de que existem novos materiais que apelida de materiais digitais, que são produzidos no âmbito das actividades do dia-a-dia das organizações e indivíduos e fazem parte da sua memória, que podem ser nadodigitais ou resultado de digitalização mas não existem noutro meio que não o digital, que incluem qualquer tipo de informação e formato, conquanto seja em código binário, que envolvem um processo de codificação/descodificação entre código humano e código binário, sendo necessário um computador73 para tal, que pode estar em linha ou fora de linha, que pode existir em diversos formatos e suportes, que necessita de elementos para a sua governamentais on-line. Cft. DURANTI, Luciana; PRESTON, Randy, eds. - InterPARES 2: Experiential, interactive and dynamic records. 70 - InterPARES 2 Project glossary. 71 BARBEDO, Francisco [et al.] – Recomendações para a produção de planos de preservação digital, 2008, p. 4. 72 BARBEDO, Francisco; CORUJO, Luis; SANT’ANA, Mário – Recomendações para a produção de planos de preservação digital, 2011, p. 5. 73 Na nossa opinião trocaríamos aqui o termo computador pelo conceito Sistema Intermediário, isto é, o conjunto de dispositivos - software e hardware - que foram utilizados para criar o documento e que serão igualmente necessários para ler e apresentar esse mesmo documento. Este conceito é mais cómodo face à profusão de dispositivos que têm surgido no mercado, e que, seja por nomes puramente comerciais ou por categorias tecnológicas, não se assumem como computadores. 21 referenciação baseados no seu conteúdo, contexto, estrutura e apresentação, e que exigem requisitos de autenticidade, fidedignidade, integridade e usabilidade/inteligibilidade.74 Para além destas características, podemos ainda reconhecer a sua versatilidade e dinamismo, na medida em que neles podem ocorrer operações, muitas vezes sem intervenção humana75, como por exemplo a data mudar automaticamente. Para além disso, podem ser complexos, na medida em que podem integrar diversas componentes digitais, como o caso de um ficheiro de texto com uma imagem embebida, sendo então composto por duas componentes: o texto (os dados de caracteres) e aquele que reproduz a imagem (mapa de bits). Estes componentes podem ou não estar armazenados no mesmo ficheiro físico, como é o caso dos sítios web. Outra característica prende-se com a sua linearidade/não linearidade. A linearidade verifica-se quando, ao ser transposto para suporte analógico, não perde informação significativa (na prática há sempre informação, como o nome do ficheiro, e metainformação perdidas). A nãolinearidade verifica-se quando a transposição é impossível, como é o caso de imagens em movimento e sons. Camadas constituintes do Objecto Aludindo à definição de objecto digital, é irresistível a referência à abordagem multicamada de Thibodeau76, um conceito que deu origem a várias adaptações, das quais apresentamos três. Assim, para este autor: All digital objects are entities with multiple inheritance; that is, the properties of any digital object are inherited from three classes. Every digital object is a physical object, a logical object, and a conceptual object, and its properties at each of those levels can be significantly different. A physical object is simply an inscription of signs on some physical medium. A logical object is an object that is recognized and processed by software. The conceptual object is the object as it is recognized and understood by a person, or in some cases recognized and processed by a computer application capable of executing business transactions. Ou seja, como objectos físicos, são constituídos por "inscrições" (geralmente os estados binários "activo" ou "inactivo") no objecto que serve de suporte, sejam eles suportes ópticos ou suportes magnéticos. Mesmo os objectos digitais que se encontram em linha na “Nuvem” ou no "ciberespaço" têm que existir em suportes físicos localizáveis em algum sítio. De acordo com Miguel Ferreira, o objecto físico constitui aquilo que é passível de ser interpretado pelo hardware, que transforma os símbolos inscritos no suporte físico num conjunto de dados passíveis de serem manipulados pelo software.77 Como objectos lógicos, ou seja, um código processável pelo software, e a sua existência num dado momento depende das inscrições físicas, mas não está vinculada a um suporte em particular. Para Miguel Ferreira: 74 PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 125-126 BARBEDO, Francisco - Arquivos digitais: da origem à maturidade, p. 7-8. 76 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years, p. 6. 77 FERREIRA, Miguel – Introdução à preservação digital, p. 22. 75 22 “Esse conjunto de dados encontra-se organizado segundo as regras decretadas pelo software utilizado na criação do objecto digital. Essas regras ou estruturas de dados constituem aquilo que vulgarmente se designa por formato de um objecto digital. “78 Como objectos conceptuais que têm um significado para o ser humano, contrariamente aos objectos lógicos ou materiais que os codificam num determinado momento (os objectos conceptuais podem ser reconhecidos como o resultado apresentado ao utilizador). Para que isso aconteça é necessário que o software assuma a responsabilidade de preparar o objecto lógico para ser apresentado a uma pessoa, para que o computador converta os sinais digitais em sinais analógicos que serão apresentados ao utilizador através de periféricos de saída.79 Como já foi dito surgiram adaptações, das quais damos conta em seguida. A UNESCO, pela mão da National Library of Australia, nas Guidelines for the Preservation of Digital Heritage, sugere ainda a existência de uma quarta camada a ter em conta para efeitos de preservação do objecto digital, e que é definida pelos grupos de elementos essenciais que contêm a mensagem, a finalidade ou as características pelas quais se decidiu preservar o material, referindo que a maioria dos objectos digitais contêm uma camada adicional a considerar, na medida em que muitos são composto por vários elementos, alguns dos quais são mais importantes do que outros em levar a essência da mensagem do objecto.80 Azevedo Pinto defende esta adaptação afirmando que as características, ou “significant properties”, pelas quais se decidiu preservar o material podem incluir os aspectos relacionados com a autenticidade e o ciclo de vida, que garantem o acesso a futuros utilizadores à própria informação, ou essência, e a metainformação, que a descreve, representa e garante as condições da sua preservação a longo prazo.81 Também Miguel Ferreira, em 2006 sugere a existência de uma quarta camada, diferente da indicada pelo documento da UNESCO: “Não obstante, cada ser humano acaba por fazer uma interpretação individual do objecto recebido. Essa interpretação será aqui designada por objecto experimentado.”82 Segundo o autor, apesar de ser teoricamente possível captar e preservar o objecto experimentado, as estratégias de preservação por ele apresentadas não abordam seriamente esta questão. O modelo multicamadas apresentado pela Direction des Archives de France, com apoio da Bibliothèque Nationale de France e do Centre National d’Études Spatiales (CNES) refere-se à 78 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 15. 79 FERREIRA, Miguel – Introdução à preservação digital, p. 22-23. 80 WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage, p. 36. 81 PINTO, Maria Manuela Azevedo – PRESERVMAP, p. 131. 82 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 16. 23 informação digital e é composto por cinco camadas, a saber a camada física, a camada binária, a camada de codificação, a camada elemento, e a camada objecto. Assim, a camada física é o tipo de suporte usado para registar os bits, e está frequentemente ligado a uma tecnologia de gravação que define também o formato de registo da informação.83 A camada binária descreve a organização dos bits (tamanho84 e ordem de dados85), ligado ao nível léxico. Esta camada mascara as características específicas do suporte físico, tais como formatos de pacotes registados fisicamente, espaços entre os registos, códigos de correcção de erros.86 A camada de codificação permite passar de uma representação de dados para outra e descreve a estrutura do tamanho dos bits ou conjuntos de bits, estando ligado ao nível sintáctico. Esta camada permite transformar os bits de um ou vários bytes em informação básica que pode consistir num caractere alfabético87, um sinal de pontuação, um algarismo, um nome, uma representação da cor de um pixel numa imagem.88 A camada elemento descreve o que significa um conjunto de bits, tendo então a ver com o significado da estrutura utilizada. O conhecimento do tipo de codificação não é suficiente, devendo saber também a correspondência na tabela "código  significado utilizado".89 Trata-se de um nível semântico básico, uma vez que se limita a dar um primeiro significado a uma estrutura.90 A camada objecto descreve como são reunidos os elementos e os seus significados, e a informação adquire aqui sentido. Para serem inteligíveis, os objectos, que normalmente são armazenados em ficheiros, necessitam de um conjunto de softwares para poderem ser interpretados e de materiais para poderem ser representados. São aplicações que permitem as interacções possíveis entre objectos e informação: criação, manipulação, modificação, interpretação, destruição.91 Por exemplo, para visualizar um objecto, um ficheiro no formato “.docx”, precisamos da versão correcta da aplicação Word da Microsoft, das fontes (tipo de letra) utilizadas nesse ficheiro e um computador com um ecrã. 83 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 28. Refere-se à sequência de bits de tamanho fixo que é processado em conjunto numa máquina. Esses tamanhos podem ser de 8 bits, 16 bits, 32 bits, 64 bits, dependendo do sistema intermediário utilizado. 85 Refere-se à ordem utilizada para representar os dados ou os bits. Podem ser guardados por ordem crescente do seu "peso numérico", chamado Little-Endian, ou por ordem crescente do seu "peso numérico”, chamado Big-Endian. Por exemplo, o número 12 é representado em código binário 1100 numa forma e 0011 noutra. 86 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 29-30. 87 Por exemplo, para a representação de caracteres, temos codificações simples, como o ASCII para os caracteres do alfabeto inglês, em que cada caracter está codificado em 7 bits, ou a ISO 8859-1:1998 para os caracteres do alfabeto latino, em que cada caracter está codificado em 8 bits (1 byte ou octeto), e temos codificações complexas, como o UTF-8 que é utilizado normalmente para codificar os caracteres das tabela UNICODE, e que pode utilizar 1 a 6 bytes ou octetos, isto é, de 8 a 48 bits. 88 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 30-31. 89 Por exemplo, no caso dos caracteres UNICODE, tem a ver com as várias tabelas que definem, para um valor numérico (a posição no código), tendo em conta como foi codificado, o sinal gráfico (o glifo) correspondente a representar. 90 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 31. 91 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 32. 84 24 Pode-se aventar a relação entre estas camadas com os três níveis de problemas de comunicação apresentados por Shannon92 (1949):  O problema técnico: Ligada ao grau de exactidão da transmissão da mensagem;  O problema semântico: Ligada ao grau de precisão da “comunicação” do significado;  O problema da eficácia: Ligada ao grau de sucesso com que o significado “comunicado” afecta o comportamento do destinatário. Assim o problema técnico referia-se à passagem do objecto físico para o objecto lógico, na medida em que está ligado à exactidão da comunicação de um conjunto discreto de símbolos, inscritos ou registados num suporte, como um conjunto de dados codificado processável por um software. O problema semântico prender-se-ia com a passagem do objecto lógico ao objecto conceptual, na medida em que está relacionado com a identificação, ou aproximação suficientemente satisfatória, na interpretação do significado pelo receptor, em comparação com o significado pretendido do remetente, ou seja, que o software consegue apresentar o conjunto de dados por ele processado como algo devidamente reconhecível pelo receptor (humano). Finalmente, o problema da eficácia reportar-se-ia à passagem do objecto conceptual ao objecto experimentado (tal como referido por Ferreira93), ligado ao grau de sucesso com que o significado transmitido ao receptor resulta na conduta desejada de sua parte, ou seja, se o consumidor compreende a intenção da mensagem e consegue usufruir dela, utilizando-a e adaptando-a às suas intenções. Estratégias de Preservação Tendo como base esta perspectiva, Thibodeau considera que é necessário identificar quais os objectivos que se pretendem alcançar com a preservação digital, para podermos seleccionar a melhor estratégia de preservação digital. Esta selecção deve ter em conta quatro critérios, a exequibilidade, a sustentabilidade, a viabilidade e a pertinência. O primeiro critério requer hardware e software capazes de implementar a estratégia, o segundo critério significa que a estratégia pode ser utilizada a longo prazo ou que há garantias para considerar outra estratégia no futuro que substitua a utilizada actualmente. A sustentabilidade de cada estratégia tem componentes internos e externos em que os primeiros estão relacionados com a imunidade ou isolamento da estratégia face à obsolescência tecnológica, e os segundos com a capacidade de se relacionar com outras estratégias, em termos de pesquisa e disseminação, que continuará a evoluir. O terceiro critério tem a ver com a necessidade da implementação ser feita dentro de limites aceitáveis de dificuldade e custos, e o último critério prende-se com os tipos de objectos a preservar e os objectivos específicos da preservação. Relativamente aos tipos de objectos a preservar, pode-se definir um espectro de possibilidades que vai desde a preservação da tecnologia até à preservação dos objectos que são produzidos usando tecnologias da informação digitais.94 92 SHANNON, Claude; WEAVER, Warren – The mathematical theory of communication, p. 4. Cft. FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 16. 94 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years, p. 15-16. 93 25 Esta divisão entre estratégias de preservação da tecnologia, ligadas ao objecto físico e/ou lógico, e estratégias de preservação do objecto (objecto conceptual) é consentânea com a sistematização apresentada por Lee [et al.] em 2002 que classifica as estratégias de preservação de acordo com duas perspectivas, uma mais conservadora em que se preserva o ambiente tecnológico original para descodificar a informação digital no futuro, e outra ligada à superação do problema da obsolescência técnica dos formatos dos ficheiros.”95 Na primeira abordagem estes autores incluem uma das técnicas de preservação identificadas em 1996 pela Task Force on Archiving of Digital Information da Research Libraries Group (RLG) e da Commission on Preservation and Access (CPA)96, a Preservação de Tecnologia, e a Emulação, tal como referida por Rothenberg97 em 2000. A segunda abordagem inclui a Migração, também referida pela Task Force on Archiving of Digital Information da RLG/CPA98, e o Encapsulamento, referido por Waugh, [et al.]99 em 2000. Thibodeau apresenta uma grelha em que mapeia as estratégias de preservação, tendo em conta em que um dos eixos representa, num dos extremos, a incidência da estratégia de preservação no objecto físico e/ou lógico, e no outro extremo a incidência da estratégia de preservação ou no objecto conceptual. No outro eixo, e de acordo com Ferreira: “No eixo vertical as várias estratégias são dispostas mediante o seu grau de especificidade, i.e., se são estratégias apenas aplicáveis a uma dada classe de objectos digitais ou se se tratam de estratégias genéricas, passíveis de ser administradas a qualquer classe de objectos digitais.”100 Thibodeaux aduz assim várias metodologias de preservação digital, agrupadas em três grandes conjuntos101, sendo o primeiro a preservação de tecnologia, que pretende manter os dados em formatos e suportes específicos e utilizar a tecnologia originalmente associada a esses formatos e suportes para aceder aos dados e reproduzir os objectos [Emulação, Chips programáveis, Manutenção da Tecnologia original]. No meio, as estratégias que migram formatos de dados à medida que a tecnologia evolui, permitindo o uso de tecnologia actual para a pesquisa, acesso e reprodução. [Computador Virtual Universal, Máquina Virtual, Reengenharia de Software, Visualizadores, Conversão para formatos do mesmo tipo de dados, Pedra de Rosetta, Normalização de formatos, Migração de versões]. E finalmente a preservação dos objectos, com estratégias focadas na preservação das características significativas dos objectos e que são definidas explicita e independentemente de qualquer 95 LEE, Kyong-Ho [et al.] - The state of the art and practice in digital preservation, p. 95. WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information. 97 ROTHENBERG, Jeff - Preserving authentic digital information. 98 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, http://www.dpconline.org/advice/preservationhandbook/organisationalactivities/storage-and-preservation. 99 WAUGH, Andrew [et al.] - Preserving digital information forever. 100 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 16. 101 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years, p. 19. 96 26 software ou hardware específico. importação/exportação de objectos]. [Arquivos Persistentes e Formatos de O autor enfatiza, no entanto, que os métodos que apresenta não incluem todos os que foram propostos ou testados para a preservação digital, nomeadamente métodos que se focam na metainformação. Por outro lado, para alguns ele apresenta métodos que ainda não foram mencionados como estratégias de preservação, como forma de demonstrar a robustez da grelha por ele apresentada, para demonstrar que é preciso estar aberto às possibilidades que o desenvolvimento tecnológico está constantemente a criar, e finalmente para se verificar que a preservação em ambiente digital não é somente para transmitir informação diacronicamente, mas também a nível de fronteiras no espaço, na tecnologia e instituições, pelo que os métodos a desenvolver como estratégia devem permitir a transmissão de informação confiável e com autenticidade de forma transversal a essas fronteiras.102 Por sua vez, a UNESCO103 (2003) divide as estratégias em cinco tipos:  Estratégias de investimento, que envolvem investimento de empenho no início: utilização de normas; extracção e estruturação de dados; encapsulamento; restringir o número de formatos a gerir; abordagem ligada à máquina virtual universal;  Estratégias a curto prazo: preservação de tecnologia; retrocompatibilidade e migração de versões; migração (também funciona a longo prazo);  Estratégias de médio-longo prazo: migração; visualizadores; emulação; máquina virtual universal;  Estratégias alternativas: abordagens não-digitais, recuperação de dados;  Combinação de estratégias. O Digital Preservation Coalition (DPC) faz a sua divisão entre estratégias primárias (a Migração e a Emulação) e estratégias secundárias (Preservação de tecnologia, Adesão a Normas, Retrocompatibilidade, Encapsulamento, Conversão para Formato Analógico Estável, Arqueologia Digital): “Primary preservation strategies as defined here are those which might be selected by an archiving repository for medium to long-term preservation of digital materials for which they have accepted preservation responsibility. Secondary preservation strategies are those which might be employed in the short to medium term either by the repository with long-term preservation responsibility and/or by those with a more transient interest in the materials.”104 102 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years, p. 18. 103 WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage, p. 122-123. 104 BEAGRIE, Neil ; JONES, Maggie – Preservation management of digital materials: a handbook. 27 Miguel Ferreira apresenta105 as seguintes estratégias de preservação: a Preservação da Tecnologia, o Refrescamento, a Emulação, a Migração/Conversão, que inclui Migração para Suportes Analógicos, Actualização de Versões, Conversão para Formatos Concorrentes, Normalização, Migração a-pedido e a Migração Distribuída, o Encapsulamento, e a Pedra de Rosetta Digital. Face a toda esta panóplia de métodos e estratégias, e propostas de tipologias das mesmas, decidiu-se apresentar de forma mais aprofundada as estratégias identificadas pela DGARQ106, num documento do qual partilhamos a autoria:  A preservação de tecnologia refere-se à conservação e manutenção de todo o hardware e software necessários à correta apresentação dos OD107, focando-se então na preservação do objecto digital na sua forma original108, e não no objecto conceptual. As desvantagens desta estratégia passam pela inevitabilidade da obsolescência acabar por afectar qualquer plataforma tecnológica109, pelas dificuldades colocadas pela gestão do espaço físico, pela manutenção e custos de operação110, e ainda porque o acesso à informação fica limitado ao local físico onde se encontra o hardware e software, com os condicionalismos acrescidos que daí advém no âmbito da reutilização da informação.111  A emulação prende-se com a utilização de uma aplicação de software - o emulador - para reproduzir o comportamento de uma plataforma de hardware e/ou software, numa outra plataforma que, em condições habituais, seria incompatível.112 Esta estratégia é vantajosa na medida em que permite a preservação fiel das características e funcionalidades do objecto digital original113 e, apesar de estar centrada na preservação do objecto lógico no seu formato original, não padece dos principais problemas da estratégia de preservação de tecnologia (Ex.: envelhecimento do hardware).114 As suas desvantagens passam pelo risco do emulador também se tornar obsoleto115 e a sua utilização presume que, a médio-longo prazo, os utilizadores saibam operar adequadamente aplicações e sistemas operativos não 105 FERREIRA, Miguel – Introdução à preservação digital, p.32-45 e FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 22-34. 106 BARBEDO, Francisco; CORUJO, Luis; SANT’ANA, Mário – Recomendações para a produção de planos de preservação digital, 2011, p. 47 e 52-55. 107 Cft. BEARMAN, David - Collecting software: a new challenge for archives & museums; WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information; SWADE, Doron - Preserving software in an object-centred culture; HENDLEY, Tony – Comparison of methods and costs of digital preservation. 108 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 22. 109 HENDLEY, Tony – Comparison of methods and costs of digital preservation. 110 LEE, Kyong-Ho, [et al.] - The state of the art and practice in digital preservation. 111 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years. 112 ROTHENBERG, Jeff - Avoiding technological quicksand. 113 LEE, Kyong-Ho, [et al.] - the state of the art and practice in digital preservation. 114 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 22. 115 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years. 28 existentes há muito. (Ex.: num futuro próximo será difícil conceber que os utilizadores estejam aptos a enfrentar as particularidades do sistema operativo MS-DOS).116  A estratégia de monitorização pressupõe a existência de processos de verificação manual, semiautomática e automática dos objectos digitais, sendo as duas primeiras opções mais racionais por questões de custos. As principais questões em que se centram as preocupações da monitorização têm a ver com o tempo médio de prevalência de uma versão de aplicação informática (3 anos), tempo de vida estimado dos suportes de armazenamento; retrocompatibilidade do software assegurada pelos fabricantes (em média 3 versões anteriores).  A estratégia de encapsulamento implica a preservação do objecto digital, juntamente com toda a informação considerada necessária e suficiente para garantir o desenvolvimento futuro de software aplicacional para conversão, visualização ou emulação (por exemplo, a descrição formal e detalhada do formato de ficheiro do objecto a preservar).117 Esta estratégia está direccionada para os objectos que terão interesse apenas num futuro longínquo, permitindo o adiamento da responsabilidade de preservação, apesar de o nível de complexidade dos objectos obrigar à existência de especificações complexas, que, se incompletas, podem conduzir a um efeito desastroso para a preservação do objecto digital.  A transferência de formatos e suportes diz respeito à passagem de documentos contidos num determinado suporte ou formato para outro suporte ou formato mais actualizado118, num processo que reorganiza os elementos de informação que constituem os objectos digitais.119 Esta estratégia tem essencialmente a ver com a preservação do conteúdo intelectual, isto é, com a preservação do objecto conceptual e a verificação frequente da integridade dos suportes físicos.120 O objectivo desta estratégia é evitar a obsolescência tecnológica, mantendo os objectos digitais compatíveis com as tecnologias atuais, para garantir a sua interpretação sem ter de recorrer a artefactos menos convencionais.121 Esta estratégia pressupõe processos de refrescamento a nível de suportes (por exemplo: de Disquete para CD-R ou de CD-R para DVD-R), nos casos em que existam e sejam utilizados estes suportes, a migração entre formatos (por exemplo: de Word 97 para Word 2000), e a transposição conjunta de formatos e suportes. As desvantagens apresentadas por esta estratégia derivam da probabilidade de algumas propriedades dos objectos digitais não serem correctamente transportadas para o formato de destino adoptado122, da incompatibilidade que pode existir entre os formatos de origem e destino, da inadequação 116 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 22. 117 PAÍSES BAIXOS. Nationaal Archief - Digital preservation testbed white paper: migration: context and current status. 118 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information. 119 LAWRENCE, Gregory W. [et al.] - Risk management of digital information. 120 RUSSELL, Kelly - Digital Preservation and the CEDARS project experience. 121 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 26. 122 Cft. HESLOP, Helen; DAVIS, Simon; WILSON, Andrew - An approach to the preservation of digital records; HEDSTROM, Margaret - Digital preservation: problems and prospects. 29 do software de conversão e da obsolescência de formatos.123 Para além disso, este processo, no âmbito da transposição para novos formatos, acarreta sempre perda de informação em termos da estrutura, da metainformação e, por vezes, do conteúdo, pelo que se deve recorrer a estratégias que incluam a documentação exaustiva de todo o processo de migração (metainformação) que demonstre o que se perdeu, quando e como se perdeu. Este cuidado pretende evitar que as perdas não comprometem a autenticidade e fidedignidade do documento. No âmbito da transferência de formatos existem algumas variantes, que passam pela actualização de versões, caracterizada pela actualização dos formatos utilizando software retrocompatível (por exemplo, a utilização do Word 6 para actualizar um documento criado com o Word 5), a conversão para formatos concorrentes, que permite superar o risco de descontinuidade de formatos, convertendo o objecto digital para formatos semelhantes, independentemente da aplicação informática utilizada na sua criação (por exemplo, converter um documento Word para PDF), a normalização, que corresponde à migração para um número restrito de formatos compatíveis, o que poderá evitar futuras problemas a nível de direitos de autor ou pagamento de royalties, e, finalmente promove, também, a interoperabilidade entre sistemas distintos. Ainda dentro das estratégias de preservação deve-se ter em atenção a elementos como a análise de riscos, o registo de formatos e a metainformação. A análise de riscos é um conjunto de actividades no âmbito da gestão de risco, e que pretende identificar as ameaças e o risco de ocorrências, para assim prever as mais prováveis e tomar decisões sobre a melhor forma de se precaver contra elas mediante a aplicação dos métodos mais adequados.124 O DRAMBORA125, que será aprofundado no capítulo 5, é um exemplo de metodologia e ferramenta para efectuar a análise de risco nos repositórios digitais. O registo de formatos pretende recolher informação relacionada com os formatos de ficheiro, nomeadamente a sua estrutura e ambiente de hardware e software, assim como outros componentes técnicos necessários para suportar o acesso de longo prazo aos documentos de arquivo electrónicos e outros objectos digitais de valor cultural, histórico ou de negócio, garantindo que no futuro, seja possível a existência de aplicações que interpretem os ficheiros e permitam aceder à informação neles contida. Exemplo disso é o PRONOM126, um registro técnico de acesso via web para apoiar os serviços de preservação digital, desenvolvido pelo Arquivo Nacional do Reino Unido. Outros projectos são o Global Digital Format Registry (GDFR)127 e, mais recentemente, o Unified Digital Format Registry (UDFR)128, que pretende unificar as funções e recursos do PRONOM e do GDFR numa plataforma comum. No que respeita à metainformação, na sua acepção mais básica trata-se de informação sobre informação, mais concretamente, dados estruturados sobre informação capturada no sistema de arquivo, e que permite a descrição dos atributos do documento de arquivo electrónico, fornecendo-lhe significado, contexto e organização, o que 123 Cft. FERREIRA, Miguel; BAPTISTA, Ana Alice; RAMALHO, José Carlos - A foundation for automatic digital preservation; LAWRENCE, Gregory W. [et al.] - Risk management of digital information; RAUBER, Andreas; ASCHENBRENNER, Andreas - Part of our culture is born digital: on efforts to preserve it for future generations. 124 WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage, p. 52-53. 125 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment. 126 REINO UNIDO. National Archives – PRONOM: The technical registry. 127 HARVARD UNIVERSITY. Harvard Library - Global Digital Format Registry. 128 UNIVERSITY OF CALIFORNIA. Curation Center - Unified Digital Format Registry. 30 permite a produção, gestão e utilização de documentos de arquivo ao longo do tempo, assim como nos, e através dos, domínios em que são produzidos. Uma vez que os documentos electrónicos são dependentes do sistema intermediário, a metainformação permite a contextualização dos objectos digitais no âmbito da sua produção, gestão e preservação. Esta revela-se assim, importante para a preservação digital, na medida em que, ao estar associada aos objectos digitais, permite para cada um desses objectos digitais, a sua referenciação única e persistente, a sua localização e recuperação expedita, a criação do seu histórico, e o registo das transformações neles realizados. A questão da metainformação será abordada mais adiante, principalmente no capítulo 4. Quadro Teórico de Referência No que se refere à preservação digital é preciso falar ainda do quadro teórico de referência, isto é, os fundamentos intelectuais que a sustentam. A publicação, em 1996, do relatório “Preserving digital information: Report of the task force on archiving of digital information”129 pela Research Libraries Group (RLG) e Commission on Preservation and Access (CPA), fruto de um grupo de trabalho constituído dois anos antes, com o objectivo de investigar o que era necessário para garantir a preservação a longo prazo e acesso continuado aos documentos electrónicos tornou-se um marco que ajudou a definir a conceitos-chave, requisitos e desafios.130 Esse grupo de trabalho propôs o desenvolvimento de um sistema nacional de arquivos digitais que assumissem a responsabilidade do armazenamento e acesso de informação digital a longo prazo; apresentou o conceito de repositório digital confiável e definiu o seu papel e responsabilidades; identificou cinco características da integridade da informação digital (conteúdo, fixidez [inalterabilidade/estabilidade], referenciação, proveniência e contexto), que foram posteriormente incorporadas na definição de Informação de Descrição de Preservação do Modelo de Referência OAIS (Open Archival Information System)131 e definiu a migração como uma função essencial nos arquivos electrónicos. Os conceitos e as recomendações descritas no relatório estabeleceram as bases para pesquisas e iniciativas de preservação digital posteriores.132 O Modelo de Referência OAIS foi desenvolvido em 2002 com a intenção de normalizar a prática da preservação digital e fornecer um conjunto de recomendações para implementação de programas de preservação. O OAIS diz respeito a todos os aspectos técnicos do ciclo de vida de um objecto digital, desde a Ingestão, Armazenamento, Gestão de Dados, Administração, Acesso e Planeamento de preservação. O modelo também aborda questões ligadas à metainformação, recomendando cinco tipos de metainformação para cada objecto digital: informação de referenciação (identificação); informação de proveniência (incluindo o histórico de preservação), o contexto, fixidez (indicadores de autenticidade), e de representação 129 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information. 130 MCGOVERN, Nancy - Principles and good practice for preserving data. p. 5–6. 131 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS). 132 CONWAY, Paul - Preservation in the age of google: digitization, digital preservation, and dilemmas, p.66–67. 31 (formatação, estrutura de ficheiro, e o que "confere sentido ao bitstream de um objecto").133 Este modelo de referência vai ser aprofundado no capítulo 4. A publicação de Trusted Digital Repositories: Attributes and Responsibilities em 2002, fruto da colaboração, iniciada dois anos antes, entre o Research Libraries Group (RLG) e Online Computer Library Center (OCLC), permitiu identificar as características para repositórios digitais para organizações de investigação, baseando-se e consolidando o Modelo OAIS. Este documento define Repositório Digital Confiável como aquele cuja missão é fornecer acesso a longo prazo de confiança de recursos digitais geridos, à sua Comunidade Designada, na actualidade e no futuro. O Repositório Digital Confiável deve incluir sete atributos: conformidade com o modelo de referência OAIS, a responsabilidade administrativa, a viabilidade organizacional, sustentabilidade financeira, adequação tecnológica e de procedimentos, a segurança do sistema, a responsabilidade (accountability) de procedimentos. O Modelo de Repositório Digital Confiável descreve as relações entre esses atributos. O relatório também recomenda o desenvolvimento colaborativo da certificação de repositórios digitais, modelos de redes de cooperação e partilha de pesquisa e informação sobre a preservação digital referente aos direitos de propriedade intelectual.134 Em 2004, H. Gladney propõe outra abordagem para a preservação de objectos digitais que prevê a criação de "Objectos digitais Confiáveis”, que podem dar conta da sua própria autenticidade, uma vez que integram um registo do seu histórico de utilização e modificações, permitindo que futuros utilizadores possam verificar a validade do conteúdo do objecto.135 O International Research on Permanent Authentic Records in Electronic Systems (InterPARES) é uma iniciativa de pesquisa colaborativa liderada pela Universidade de British Columbia, que se foca nas questões de preservação de documentos digitais autênticos a longo prazo. A pesquisa está a ser realizada por grupos de discussão de várias instituições dos vários continentes, com o objectivo de desenvolver teorias e metodologias que sirvam como base para estratégias, normas, políticas e procedimentos necessários para garantir a trustworthiness [confiança]136, a reliability [credibilidade]137 e accuracy [precisão/exactidão] dos documentos de arquivo electrónicos a longo prazo.138 O Projecto InterPARES desenrola-se numa primeira fase, entre 1999 e 2001, e estava focado em estabelecer requisitos de autenticidade de documentos inactivos produzidos e mantidos em grandes bases de dados e sistemas de gestão documental criados por organismos governamentais.139 O InterPARES 2 (2002 – 2007) concentrou-se em questões de confiabilidade, exactidão e autenticidade dos documentos de arquivo durante 133 CORNELL UNIVERSITY; ICPSR; MIT - Digital preservation management: implementing short-term strategies for long-term problems. 134 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities. 135 GLADNEY, HENRY - Trustworthy 100-year digital objects: evidence after every witness is dead. 136 trustworthy (adj) able to be trusted as being honest, safe, or reliable http://www.macmillandictionary.com/thesaurus-category/british/Reliable-and-trustworthy. 137 Reliable (adj) a reliable person is someone who you can trust to behave well, work hard, or do what you expect them to do. http://www.macmillandictionary.com/thesaurus-category/british/Reliable-andtrustworthy. 138 SUDERMAN, Jim - Principle-based concepts for the long-term preservation of digital records. 139 DURANTI, Luciana - The long-term preservation of authentic electronic records, 2001. 32 todo o seu ciclo de vida, e examinou os documentos de arquivo produzidos em ambientes dinâmicos no decurso de actividades artísticas, científicas e governamentais online.140 A terceira fase (InterPARES 3) foi iniciada em 2007. O seu objectivo é utilizar o conhecimento teórico e metodológico criado pelo InterPARES e outros projectos de investigação de preservação para desenvolver as orientações, planos de acção e programas de formação sobre preservação a longo prazo de documentos de arquivo autênticos para pequenas e médias organizações de gestão documental e arquivo.141 As Recomendações para a Produção de Planos de Preservação Digital142, tem como objectivo a produção de um documento estratégico que contenha políticas, procedimentos e práticas/actividades para a constituição de uma estrutura técnica e organizacional que permita preservar e gerir de forma continuada os objectos digitais, por forma a mantê-los utilizáveis, do ponto de vista administrativo e eventualmente patrimonial durante o período de tempo considerado necessário. Tal passa pela identificação e caracterização da informação digital produzida pelo organismo, identificação dos procedimentos a realizar para evitar a obsolescência tecnológica e perda de informação, e definição das responsabilidades relativas à execução desses procedimentos dentro da organização. Isto implica a categorização dessa informação de acordo com necessidades operacionais e identificação dos prazos de conservação das classes de informação identificadas. Esta análise incide sobre entidades como os Sistemas onde é produzida e/ou armazenada a informação digital, os actores que agem sobre esses sistemas e qual o seu papel. Também verificará o conteúdo informacional, a relação entre os vários sistemas do ponto de vista informacional e funcional, e finalmente informação sobre a plataforma tecnológica, nomeadamente o sistema intermediário, formatos, procedimentos e infrastruturas de segurança do sistema e da informação. A implementação, execução e monitorização de um Plano de Preservação Digital passa pela atribuição de novas responsabilidades e tarefas num quadro de actividade transversal continuada da organização que se coadune com uma gestão da mudança. O resultado implica a identificação, racionalização e melhor utilização continuada da informação digital no âmbito das actividades da organização, pelo conhecimento de entidades como os sistemas de informação, os agentes e os seus papéis, e as relações entre tais entidades no âmbito organizacional e funcional, pelo desenvolvimento e ampliação de competências, conhecimento e infrastruturas referentes à preservação digital e que permitam o desenvolvimento de outros projectos, racionalização de recursos derivada da eliminação da informação desnecessária.143 140 DURANTI, Luciana; PRESTON, Randy, eds. - International research on permanent authentic records in electronic systems (InterPARES) 2: experiential, interactive and dynamic records. 141 LASZLO, Krisztina; MCMILLAN, Timothy, YUHASZ, Jennifer - The InterPARES 3 project: implementing digital records preservation in a contemporary art gallery and ethnographic museum, p. 4. 142 BARBEDO, CORUJO, SANT’ANA – Recomendações para a produção de planos de preservação digital, 2011. 143 BARBEDO, Francisco; MARTINS, Sílvia – Preservação digital. 33 Para concluir o Estado da Arte da Preservação Digital? Katia Thomaz144 resume as preocupações e desafios identificados e abordados por vários autores, no que se refere à preservação de documentos de arquivo electrónico nas seguintes categorias145: 1. Falta de políticas de avaliação: O impacto causado pela definição dos critérios de selecção é muito importante no ambiente digital. O documento digital que não for seleccionado nas fases iniciais do seu ciclo de vida irá provavelmente perder-se ou tornar-se inútil no futuro; 2. Falta de políticas de descrição: A natureza complexa da tecnologia exige uma abordagem descritiva e detalhada, ou seja, metainformação de objectos digitais para a manutenção. A metainformação de elementos internos e externos dos documentos tornou-se crucial; 3. Vulnerabilidade física: O Hardware e os suportes de armazenamento são inerentemente instáveis e, sem a instalação e manutenção adequada, eles podem deteriorar-se rapidamente, mesmo que externamente não pareçam estar danificados; 4. Vulnerabilidade lógica: O ambiente digital é sensível a mudanças (algumas são derivadas das próprias necessidades de gestão) o que pode comprometer a integridade, a autenticidade e a história dos objectos digitais; 5. Elevada obsolescência tecnológica: O ciclo de renovação tecnológica é curto (3-5 anos) por oposição a décadas e séculos associados à preservação de objectos físicos; 6. Elevada dependência tecnológica: Todos os objectos digitais requerem hardware e software específicos para serem acedidos e cada um desses elementos geralmente requer contratos, que são geralmente difíceis de negociar; 7. Dificuldade no recrutamento de pessoal devidamente qualificado: A tecnologia envolvida no acesso a objectos digitais requer uma significativa diversidade de actividades que são realizadas por poucos especialistas. No que se refere aos requisitos de preservação, a autora aponta o estudo de Bullock146 acerca do modelo de referência OAIS, que identifica acções ou requisitos a cumprir no âmbito da preservação digital de documentos de arquivo: 144 THOMAZ, Katia P - Critical factors for digital records preservation. Cft. BEAGRIE, Neil ; JONES, Maggie – Preservation management of digital materials: a handbook; BRAND, Stewart - Escaping the digital dark; BULLOCK, Alison - Preservation of digital information: issues and current status; CONWAY, Paul - Preservation in the digital world; UNIÃO EUROPEIA. Comissão – MoReq specification: Model Requirements for the Management of Electronic Records, 2001; HEDSTROM, Margaret - Digital preservation: a time bomb for digital libraries; ICA Committee on Electronic Records - Guide for managing electronic records from an archival perspective; LUSENET, Yola de - Digital heritage for the future; WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage; REINO UNIDO. Public Record Office - Management, appraisal and preservation of electronic records: principles; ROTHENBERG, Jeff - Ensuring the longevity of digital information; THIBODEAU, Kenneth - Building the archives of the future; WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information. 146 BULLOCK, Alison - Preservation of digital information: Issues and current status. 145 34 1. A fixação do objecto como um todo discreto: Os limites de um objecto digital não são claros, especialmente um objecto composto criado pela reunião de diferentes suportes ou através da ligação a vários recursos existentes numa rede; 2. Preservar a presença física: Refere-se a manter o ficheiro de computador, a série de 1s e 0s que são a base de um objecto digital; 3. Preservar o conteúdo: Refere-se a manter a possibilidade de aceder o conteúdo no seu nível mais baixo (por exemplo, texto ASCII) sem os embelezamentos de variações de fontes e funções de layout; 4. Preservar a apresentação: Refere-se a manter a aparência original de um objecto digital. As especificações de layout também devem ser preservadas, especialmente quando contribuem significativamente para a compreensão e interpretação do conteúdo. Especificações de layout incluem os diferentes rostos de fontes e tamanhos, o uso do espaços em branco, colunas, notas marginais, cabeçalhos, rodapés, paginação, e assim por diante, por vezes separados do conteúdo; 5. Preservar a funcionalidade: Refere-se a manter os aspectos dinâmicos de um objecto digital (por exemplo, componentes de multimédia, o formato de hipertexto, a capacidade de gerar automaticamente conteúdo dinâmico a partir armazenamentos de dados, funções de navegação e tabelas de conteúdo interactivo); 6. Preservar a autenticidade: Refere-se a assegurar um objecto digital contra alterações não autorizadas e monitorizando o objecto digital através de múltiplos ciclos de "cópia" para garantir que cada cópia é uma versão aceitável do original; 7. Localizar e referenciar o objecto original ao longo do tempo: Trata-se de ser capaz de corresponder a uma citação a um objecto digital, e para distingui-lo de outras versões ou edições; 8. Preservar a proveniência: Refere-se a afirmar a origem e a cadeia de custódia de um objecto e contribui para defini-lo como um todo. Isto ajuda a confirmar que o trabalho é autêntico e o seu conteúdo está intacto; 9. Preservar contexto: Refere-se a descrever a dependência de hardware e software de um objecto digital, e seu modo de distribuição e ligações a outros objectos digitais. A literatura aborda ainda, na perspectiva da autora, as funções de arquivo, tendo por base o modelo referência OAIS147: 1. Ingestão: A entidade OAIS que contém os serviços e funções para aceitar SIPs dos produtores, preparando AIPs para o armazenamento, e assegurando que os AIPs e a sua Informação Descritiva de apoio são integrados no OAIS; 2. Armazenamento de arquivo: A entidade OAIS que contém os serviços e funções de armazenamento e recuperação de AIPs; 147 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS). 35 3. Gestão de dados: A entidade OAIS que contém os serviços e funções para preencher, efectuar a manutenção, e o acesso a uma ampla variedade de informação. Alguns exemplos desta informação são catálogos e inventários sobre o que pode ser recuperado a partir de armazenamento de arquivo, algoritmos de processamento que podem ser executados em dados recuperados, estatísticas de acesso ao consumo, facturação do consumidor, pedidos com base em eventos, controlos de segurança e cronogramas OAIS, políticas e procedimentos; 4. Administração: A entidade OAIS que contém os serviços e funções para o controlo do funcionamento do dia-a-dia das outras entidades funcionais do OAIS; 5. Planeamento de Preservação: A entidade OAIS que contém os serviços e funções para a monitorização da ambiente OAIS e para fornecer recomendações para garantir que as informações armazenadas permanecem acessíveis à Comunidade Designada, a longo prazo, mesmo que o ambiente computacional original se torne obsoleto; 6. Acesso: A entidade OAIS que contém os serviços e funções para aceder à informação arquivística custodiada e serviços relacionados. Com base nestes dados148, nas variáveis organizacionais definidas por Chiavenato149 no Modelo de Referência OAIS150 e outras teorias gerais da gestão151, Katia Thomaz desenvolve um Modelo de Contextualização de Objectos digitais. Este modelo de Contexto inclui 12 variáveis de organização. 1. Objecto Digital de Arquivo: objecto digital criado no âmbito de uma actividade, como fim e que faz prova do mesmo, e mantido para o acesso futuro; 2. Suporte de armazenamento: diferentes tipos de materiais físicos em que são gravados e armazenados os objectos digitais de arquivo, como disquetes, disco rígidos, fitas magnéticas e discos ópticos; 3. Software de Apresentação: software que é necessário para apresentar toda ou parte de um objecto digital de arquivo, de um modo que as pessoas possam compreender; 4. Equipamento de Processamento: hardware que é necessário para processar os suportes de armazenamento e executar o software de apresentação; 5. Actividade de Manutenção: acção da organização que visa a manter correctamente - em ordem, em execução, actualizado, etc. - o objecto de arquivo digital, o suporte de armazenamento, software de apresentação, o hardware de processamento e instalação; 148 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS). CHIAVENATO, Idalberto – Teoria geral da administração. 150 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS). 151 Cft BLAU, Peter; SCOTT, W Richard - Formal organizations: a comparative approach; BOWDITCH, James; & BUONO, Anthony; STEWART, Marcus - A primer on organizational behavior; CHAMPION, Dean - Sociology of organizations; HALL, Richard; TOLBERT, Pamela - Organizations: structure, processes, and outcomes; MIRANDA, Geraldo – Organização e métodos. 149 36 6. Actividade de Negócio: uma acção da organização que visa o exercício do negócio da organização; 7. Funcionário: a pessoa, por vezes, um técnico ou um empregado menos qualificado, que realiza a actividade de manutenção; 8. Produtor: uma pessoa ou um sistema cliente que produz o objecto digital de arquivo a ser armazenado; 9. Consumidor: a pessoa ou sistema cliente interessado no objecto digital de arquivo; 10.Terceiros: a pessoa ou organização que faz os produtos, presta serviços, ou certifica (afirmar por declaração formal que é autêntico, preciso, genuíno) um objecto digital, tecnologia e instalações; 11.Instalações: um espaço físico onde está o hardware de processamento ou suportes de armazenamento; 12.Gestão: uma estrutura de organização necessária para executar as actividades de manutenção e de negócios; 13.Ambiente: todas as condições, circunstâncias e influências envolventes, e que afectam o desenvolvimento da organização. Ambiente Envolvente Gestão Actividade de Negócio Instalações Hardware Suportes Objecto Digital Terceiros Funcionário Software Produtor Consumidor Figura 1 - Modelo de Contextualização de Objectos digitais (Thomaz, 2012) 37 As relações entre as variáveis da organização mostram como o centro depende da periferia. Na verdade, o objecto de arquivo digital depende do suporte de armazenamento, onde é registado, do software de apresentação que o interpreta, no hardware de processamento que o lê e processa, da interacção entre a actividade de Manutenção, Actividade de Negócios, funcionário, Produtor, Consumidor, terceiros e as Instalações que o gerem, da gestão para estabelecer políticas de preservação e, finalmente, do ambiente no qual ele é mantido. O Modelo de Informação começa com a Gestão a gerir as diversas variáveis de organização interna. O Produtor realiza uma ou mais Actividades de Negócio que geram zero ou mais Grupos de Documentos de Arquivo, e alguns deles são definidos como Grupos de Preservação a Longo Prazo. Um Grupo de Preservação a Longo Prazo contém um ou mais Documentos de Arquivo, e alguns desses são Documentos de Arquivo Electrónicos. Um Documento de Arquivo Electrónico é composto de um ou mais Objectos Digitais que são registados em vários Suportes de Armazenamento e são apresentados por Software de Apresentação específico, ambos processados por Hardware de Processamento compatível. Este complexo tecnológico Suportes de Armazenamento, Software de Apresentação e Hardware de Processamento - é mantido por uma ou mais Actividades de Manutenção realizadas por um ou mais Funcionários. Ele também suporta uma ou mais Actividades de Negócios que suportam um ou mais Consumidores. É possível verificar a influência do Ambiente sobre todas as variáveis de organização interna em termos de mudança / evolução, incluindo a própria Administração. Existem alguns aspectos a destacar no Modelo de Informação:  a transição de Grupos de Documentos de Arquivo para Grupos de Preservação a Longo Prazo, que envolveria uma tomada de decisão complexa;  a multiplicidade do Documento de Arquivo e a delimitação dos Objectos Digitais que compõem o Documento de Arquivo;  as actividades de manutenção, quando não reúnem informação suficiente sobre os componentes tecnológicos, podem levar ao colapso do modelo; e  a dificuldade em avaliar a influência do Ambiente sobre as várias variáveis organizacionais. Além disso, a associação do Modelo de Informação com os factores de preservação digital fornece uma ampla compreensão do que é necessário para garantir a preservação cuidadosa de Documentos de Arquivo Electrónicos a longo prazo, tendo em conta as três categorias funcionais de metainformação identificados pelo Working Group on Preservation Metadata: 152 1. Descritiva: facilitar a descoberta da origem e a identificação; 2. Administrativa: apoio à gestão de origem dentro de uma colecção; 3. Estrutural: unir os componentes de objectos de informação complexos. 152 DALE, Robin [et al.] - Preservation metadata for digital objects: a review of the state of the art : a white paper. 38 O Modelo de Informação da Preservação Digital e os factores associados oferecem uma visão holística do ambiente digital e fornecem ao profissional e / ou pesquisador da Informação uma análise mais precisa dos seus componentes. Qualquer instância específica de um arquivo digital encontra-se espelhada no modelo de informação, permitindo que cada aspecto mencionado seja objecto de implementação e estudo detalhado, de modo que o pesquisador ou profissional não omita qualquer componente ou perca o sentido do todo. Este Modelo de Informação reconhece a natureza altamente distributiva dos documentos digitais na organização e a necessidade de implementação de políticas e procedimentos eficazes para apoiar a sua preservação no local. Entre as classes envolvidas na preservação digital de longo prazo, além do convencional triângulo hardware-software-dados, também considera o funcionário, o fornecedor, o fabricante, o certificador, o Suporte de armazenamento, a sala de informática, a sala de armazenamento, a Administração [gestão] e do Meio Ambiente. Há também uma grande quantidade de factores de preservação digital no interior das categorias, que terão de ser tidos em conta, não importa qual a posição da categoria no Modelo de Informação. No geral, o Modelo de Informação da Preservação Digital e os factores associados oferecem uma orientação para:  obtenção de um amplo entendimento das variáveis organizacionais envolvidas na preservação e acesso aos documentos digitais a longo prazo;  descrever e comparar estratégias de preservação digital actuais e futuras;  proporcionar uma base que pode ser expandida por outros esforços para lidar com a preservação a longo prazo dos documentos de arquivo que não estão em formato digital (por exemplo, papel, microfilme, etc.); e  orientar a identificação e produção de novas normas. Os principais resultados da investigação - Modelo de Informação da Preservação Digital, factores associados e comparações com outros aspectos-chave da literatura preservação digital - representam abordagens inovadoras e originais, e podem constituir ferramentas úteis para a gestão de preservação digital, uma vez que permitem a avaliação dos riscos associados à necessária tomada de decisão. Por exemplo, quando um programa de preservação digital é planeado, os factores negligenciados revelariam automaticamente os riscos correspondentes, ou seja, os factores, questões desafiadoras, as exigências de preservação e / ou funções de arquivamento que eram debilmente ou não considerada. A incerteza reina na ausência de informação.153 Em contraste, a informação transforma a incerteza em risco, ou seja, na probabilidade de ocorrência de um certo efeito negativo. O risco pode ser melhor previsto e gerido quando há informações suficientes e precisas. Estas ferramentas, uma vez que representam o actual estado-da-arte, devem ser constantemente revistas e actualizadas, para que possam ser adaptadas a novas soluções desenvolvidas pela evolução das tecnologias e dos processos. 153 GIDDENS, Anthony - As consequëncias da modernidade. 39 Finalmente, a investigação progrediu da teoria à prática, uma vez que este caminho fornece instrumentos de eficácia concreta. Este facto é relevante, dada a urgência de investigação, discussões e práticas relacionadas aos temas do património e da memória. 40 3 - Repositórios Digitais Quando em Junho de 2007, a UNESCO avança com o documento Towards an Open Source Repository and Preservation System - Recommendations on the Implementation of an Open Source Digital Archival and Preservation System and on Related Software Development, no âmbito do programa Memory of the World. Neste documento declara o seguinte: “for simple digital objects, the solution to digital preservation is relatively well understood, and that what is needed are affordable tools, technology and training in using those systems. (…) there is no ultimate, permanent storage media, nor will there be in the foreseeable future. It is instead necessary to design systems to manage the inevitable change from system to system. The aim and emphasis in digital preservation is to build sustainable systems rather than permanent carriers. (…) It is only in finding a solution to this problem that a sustainable approach will be found to meet the needs of many communities.” 154 Assim, o relatório considera que um sistema de preservação operacional deve ter em conta todas as questões relativas aos repositórios digitais, e que se os repositórios de preservação forem bem planeados, tais sistemas utilizarão soluções de preservação digital já desenvolvidos sem incorrer nos custos da sua criação. A forma como as comunidades, fornecedor e distribuidores open source atingem esses objectivos serve de modelo de como um repositório digital sustentável deve funcionar, de forma constante, e ser actualizado e desenvolvido de acordo com as necessidades. De igual modo, muitas instituições culturais, arquivos e organismos de ensino superior têm participado nas comunidades de software open source para influenciar a seu favor, e a favor de todo o sector, a direcção do desenvolvimento desse software. Owen (2007) refere que a solução para o problema da preservação do património digital seria o estabelecimento de um novo tipo de instituição patrimoniais para materiais digitais, juntamente com o reconhecimento de que as instituições patrimoniais já existentes devem continuar a tarefa de preservar o património pré-digital, especialmente aquele ligado à alta cultura e à cultura oficial. Este novo tipo de instituições, que poderiam ser nomeadas de Repositórios de Património Digital, seriam instituições de memória para a sociedade digital, englobando objectos digitais de todos os âmbitos (incluindo os seus processos de criação e utilização subjacentes) através dos quais a sociedade se expressa (o tecido digital da sociedade). São novas instituições ao lado de arquivos, bibliotecas e museus, que se baseiam mais em processos de utilização e sociais do que na produção nacional, que se baseiam em critérios de selecção debatidos publicamente, que se baseiam em investimentos financeiros públicos de recolha, armazenamento e manutenção, e que cooperam com o sector privado em termos de serviços de indexação e acesso.155 154 BRADLEY, Kevin; LEI-Junran; BLACKALL, Chris - Towards an open source repository and preservation system, p. 3. 155 OWEN, John Mackenzie – Preserving the digital heritage: roles and responsibilities for heritage repositories. p. 49. 41 Nesse mesmo ano, Bradley corrobora essas afirmações, defendendo que o actual paradigma de preservação digital conceptualiza os objectos digitais como partes de uma relação complexa, que modifica continuadamente o seu conteúdo e a sua forma, necessitando constantemente de interagir de novas maneiras com sistemas complexos. Para o autor, a preservação é cada vez mais considerada como acesso sustentado por parte dos repositórios e arquivos digitais, sendo que a ferramenta crítica neste processo, e que é fulcral em qualquer debate actual acerca da preservação digital, é o repositório digital, que idealmente guarda os materiais, fornece acesso, controla as alterações, e mantém a autenticidade do item durante o período de tempo considerado necessário para cada caso particular.156 Refere ainda que num ambiente digital sustentável, ocorre o mesmo debate inclusivo, e aqui o termo é utilizado para significar a construção de uma infrastrutura economicamente viável, tanto socialmente como tecnicamente, para manter dados valiosos sem perdas ou degradação significativas. Tal inclui toda a composição sociotécnica do repositório, o valor a curto e longo prazo do material, os custos de empreender uma acção, e o reconhecimento de que não são as tecnologias que mantêm os objectos digitais, mas sim as instituições, utilizando a tecnologia existente. Para ele não é possível preservar informação digital sem uma infrastrutura organizacional, económica, social, estrutural e técnica sustentável, nem é sensato preservar informação sem valor sustentado.157 Assim, de acordo com a perspectiva de Carla Ferreira (2011), verifica-se no início do séc. XXI uma alteração do paradigma na preservação digital em que esta: “deixa de estar centrada em acções imediatas, como a preservação dos suportes, para se concentrar em acções a longo prazo e em infra-estruturas técnicas e sociais que assegurem a perenidade dos documentos digitais. Por esta altura, assume principal destaque a investigação na área dos repositórios digitais e dos metadados de preservação.”158 Os repositórios digitais passam a ser o foco da preservação digital na medida em que estes são vistos como a garantia do armazenamento e autenticidade dos conteúdos digitais. Os repositórios digitais vão integrar as problemáticas e soluções técnicas referentes à preservação e autenticidade da informação digital, que só faz sentido guardar tendo em vista o seu acesso aos públicos. A utilização do plural tem implícito que se tratam de públicos com perfis, interesses e necessidades informacionais diferenciadas. A interoperabilidade tem aqui um lugar importante, na medida em que esses públicos integram-se não só indivíduos, mas também instituições que, por intermédio dos seus sistemas aplicacionais, pretendem aceder e captar a informação que necessitam e que se encontra nesses repositórios. Conceito e Definição Pretendemos então perceber a que se refere o conceito de repositório digital e que interpretações existem deste termo. 156 BRADLEY, Kevin– Defining digital sustainability, p. 155-156. BRADLEY, Kevin– Defining digital sustainability, p. 157. 158 FERREIRA, Carla - Preservação da informação digital : uma perspectiva orientada para as bibliotecas p. 13. 157 42 Conseguimos identificar o conceito de Repositório Digital no Relatório publicado em 1996 pela Task Force on Archiving of Digital Information da Commission on Preservation & Access (CPA)/RLG. Esta Task Force: “envisions the development of a national system of digital archives, which it defines as repositories of digital information that are collectively responsible for the long-term accessibility of the nation’s social, economic, cultural and intellectual heritage instantiated in digital form.”159 O conceito de repositório de informação digital surge aqui no âmbito dos arquivos digitais. Em Março de 2000 o RLG e o Online Computer Library Center (OCLC) iniciaram uma colaboração para estabelecer quais as características de um repositório digital para organismos de investigação, baseando-se no Modelo de Referência OAIS, que se abordará no capítulo 4. Foi criado um grupo de trabalho para identificar as características e as responsabilidades dos repositórios digitais confiáveis para colecções heterogéneas de grande escala, detidas por organizações culturais. Tal deu origem, em 2002, ao documento Trusted Digital Repositories: Attributes and Responsibilities. Para eles: “Repository: An organization that intends to maintain information for access and use.”160 Em Portugal, em 2003, Saramago refere que para as instituições que pretendem criar repositórios digitais a longo prazo poderem dar resposta ao problema dos custos da preservação devem existir discussões e consensos ao mais alto nível. A autora considera repositórios digitais os arquivos e bibliotecas digitais que decidiram manter e preservar os seus recursos ou que têm a capacidade de armazenar os recursos de outrem, fornecendo ou não acesso a utilizadores externos.161 Wheatley (2004) considera necessário identificar as finalidades da preservação digital no repositório digital para compreender o processo necessário para garantir a preservação a longo prazo dos objectos colocados no repositório, convém antes de mais perceber o que se entende efectivamente por preservação, sendo que as finalidades funcionais se podem resumir a dados que podem ser mantidos no repositório sem degradação, perda ou alterações maliciosas; dados que podem ser localizados, extraídos do arquivo e entregues a um utilizador; dados que podem ser interpretados e compreendidos pelo utilizador; e que essas finalidades devem atingidas a longo prazo.162 O autor aborda ainda a questão da estrutura do repositório, no sentido de garantir que o conteúdo do repositório sobreviva à evolução tecnológica, ou mesmo ao próprio repositório ou instituição que o custodia. Para ele, o método ou estratégia passa pelo planeamento por camadas e a escolha de tecnologias estáveis na construção do repositório. Assim, tal como a 159 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. III. 160 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 59. 161 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais, p. 5. 162 WHEATLEY, Paul - Institutional repositories in the context of digital preservation. 43 Informação de Representação precisa de ser monitorizada e actualizada tendo em conta o impacto que a obsolescência tecnológica tem nela, os repositórios necessitam eles próprios de se modificar e desenvolver ao longo do tempo. Tal modificação pode ser necessária para garantir o funcionamento continuado do arquivo face às tecnologias que utiliza se tornarem obsoletas, mas também pode derivada da solicitação de novos ou diferentes serviços no âmbito da utilização. A necessidade da sobrevivência do repositório a longo prazo tem que acarretar a ideia de que partes significativas do repositório terão que sofrer modificações. Camada Aplicacional Camada da Base de Dados Camada de Armazenamento Figura 2 - Abstracção de Repositório A figura, apresentada pelo autor, apresenta uma abstracção das camadas do repositório. Ao planear cuidadosamente as interfaces entre estas camadas, as tecnologias usadas nas próprias camadas (principalmente nas camadas superior e inferior) podem ser modificadas sem grande impacto para o repositório no seu todo. À medida que os paradigmas técnicos, funcionais e de utilizador da computação moderna se vão modificando (e vão entrando e saindo do estado de graça), temos que que estar cientes de que as aplicações delas dependem também mudarão. Assim, as interfaces externas de visualização actuais não sobreviverão mais de cinco anos na sua presente forma, e muito menos cem anos. Escolher um planeamento de alto nível correcto pode simplificar esta modificação inevitável e talvez prevenir qualquer perda de dados no processo. Ao observar as várias implementações de repositórios institucionais na web verificase a existência de vários com avisos relativos ao adicionar conteúdo em sistemas que podem encerrar sem qualquer esperança de migração dos dados para um sistema que o substitua. Os perigos da não abordagem desta questão são por demais evidentes.163 No âmbito do Digital Repositories Programme do Joint Information Systems Committee (JISC), é publicado o Digital Repositories Review em 2005, que define, de forma que considera pouco satisfatória, que uma gama cada vez maior de áreas de actividade dentro do ambiente da informação refere-se aos depósitos de colecções de conteúdos como "repositórios", numa perspectiva em que os repositórios são assim considerados colecções de objectos digitais.164 Esta entidade considera que para encorajar a comunicação entre estas áreas de actividade e promover a interoperabilidade, é necessário definir as características dos repositórios e procurar uma abordagem comum e coerente, na medida que a utilização generalizada de um termo leva a um aumento da diversidade de significados.165 Neste âmbito o JISC financiou, entre 2006 e 2013, o Repositories Support Project (RSP), uma iniciativa que visava contribuir para o desenvolvimento da capacidade, conhecimentos e 163 WHEATLEY, Paul - Institutional repositories in the context of digital preservation. HEERY, Rachel; ANDERSON, Sheila - Digital repositories review, p. 1. 165 HEERY, Rachel; ANDERSON, Sheila - Digital repositories review, p. 1. 164 44 competências no âmbito dos repositórios de instituições de ensino superior do Reino Unido. Nesse sentido define que: “A digital repository is a mechanism for managing and storing digital content. (…) Digital repositories may include a wide range of content for a variety of purposes and users. What goes into a repository is currently less an issue of technological or software ability, and more a policy decision made by each institution or administrator.”166 Em 2006 o Working Group on Trusted Repositories Certification do NESTOR - Network of Expertise in long-term STORage, com participações de várias bibliotecas e arquivos alemães e austríacos produziram a primeira versão do seu Catalogue of Criteria for Trusted Digital Repositories, afirmando que um repositório digital se define como uma organização (consistindo em sistemas de pessoas e técnicas) que assume a responsabilidade da preservação e acessibilidade a longo prazo dos objectos digitais, assegurando a sua usabilidade por parte de um grupo-alvo específico, ou "Comunidade Designada". O conceito de "longo prazo" neste conceito significa para além das modificações tecnológicas (de hardware e software) e também modificações à sua Comunidade Designada. Mais uma vez, esta definição de repositório digital baseia-se na apresentada no Modelo de Referência OAIS.167 A segunda versão, de 2008, acrescenta que: “The digital repository can be an element within a larger institution which also archives conventional objects. The connections between analogue and digital objects should be maintained and represented accordingly in the search.”168 Miguel Ferreira no seu livro, Preservação Digital, de 2006, refere que: “Repositório digital. Sistema de informação responsável por gerir e armazenar material digital.”169 O International Federation of Library Associations and Institutions (IFLA), publica, em 2008, Networking for Digital Preservation: Current Practice in 15 National Libraries, onde define: “Digital repository or electronic repository is the system (or combination of systems) that provides long-term storage and preservation of and permanent access to digital objects.”170 Arellano refere em 2008 que: “Um repositório digital é um serviço de armazenamento de objetos digitais que tem a capacidade de manter e gerenciar materiais por longos períodos de tempo e 166 JISC – What is a Repository?. In Repositories Support Project (RSP). DOBRATZ, Susanne [et al.] – NESTOR catalogue of criteria for trusted digital repositories, p. 2. 168 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 4. 169 FERREIRA, Miguel - Introdução à preservação digital, p. 71. 170 VERHEUL, Ingeborg - Networking for digital preservation, p. 21. 167 45 prover o seu acesso apropriado. (…) O propósito dos repositórios estaria dirigido a dois aspectos: o acesso e o armazenamento.“ 171 Para este autor: “Os repositórios digitais compreendem um conjunto de ferramentas necessárias para os produtores, disseminadores e usuários de documentos digitais.”172 Torna-se claro que os repositórios digitais, na sua essência, são sistemas de informação que têm o intuito de gerir e armazenar colecções de objectos digitais. Esses sistemas de informação são da responsabilidade de um organismo ou instituição, que vai definir a finalidade, os objectivos, os tipos e características dos objectos que armazena, tendo em conta as necessidades e expectativas da comunidade de interesse, potenciais clientes do repositório digital. Tal é demonstrado pela afirmação do Digital Curation Centre (DCC) e o Digital Preservation Europe (DPE), que em 2007 criam a ferramenta Digital Repository Audit Method Based on Risk Assessment (DRAMBORA), de que os repositórios formam um cruzamento de interesses de diferentes comunidades de prática: bibliotecas digitais, investigação, ensino, e-ciência, publicações, exploração de dados comerciais, gestão de documentos de arquivo, preservação. A motivação destas comunidades para criar repositórios pode diferir e os serviços chave que os repositórios podem fornecer abrangem várias áreas funcionais, como o acesso avanço a recursos, novas formas de publicação e revisão de pares, gestão de informação empresarial (sistemas de gestão de conteúdos e de documentos de arquivo); partilha de dados (reutilização de dados de investigação, objectos de ensino-aprendizagem, etc.); preservação de recursos digitais a longo prazo.173 Âmbitos de Utilização Teremos então que verificar o que a literatura científica e técnica nos diz acerca dos âmbitos de utilização dos repositórios digitais, sem no entanto deixar de falar da profusão terminológica e conceptual, já verificada pelo JISC, e dos tipos de repositórios que vão surgindo, de acordo com o Digital Repositories Programme. Repositórios e (/ou) Arquivos Digitais Precisamos então de voltar ao Relatório da Task Force on Archiving of Digital Information, de 1996, que considera que os repositórios de informação digital a que se refere estariam ligados no âmbito de um sistema de arquivo nacional através de dois mecanismos de certificação, em que o primeiro diz respeito aos repositórios que afirmam cumprir funções de arquivo devem fazer prova de que são quem dizem ser, cumprindo ou excedendo os requisitos e normas de um programa independente de certificação de arquivos, e o segundo refere-se aos arquivos digitais certificados que devem ter disponível um mecanismo à prova de falhas críticas, mecanismo esse que deve ser suportado pela vontade, recursos económicos e direitos legais 171 MÁRDERO ARELLANO, Miguel - Critérios para a preservação digital da informação científica, p. 124. MÁRDERO ARELLANO, Miguel - Critérios para a preservação digital da informação científica, p. 125. 173 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment – DRAMBORA, p. 15-16. 172 46 da organização, e que permite um repositório de arquivo certificado executar uma função de salvaguarda agressiva para salvar informação digital com importância cultural. Adicionalmente, o mesmo relatório da Task Force faz a distinção entre Arquivos Digitais e Bibliotecas Digitais define arquivo digital estritamente em termos funcionais como repositórios de informação digital que são colectivamente responsáveis pela garantia através da utilização de várias estratégias de migração, a integridade e acessibilidade a longo prazo do património social, económico, cultural e intelectual existente em forma digital. Os arquivos digitais distinguem-se das bibliotecas digitais, por estas serem repositórios que recolhem e fornecem acesso a informação digital, mas sem a obrigação de assegurarem o armazenamento e acesso a longo prazo dessa informação, podendo assim, em termos funcionais, ser consideradas ou não arquivos digitais. O documento assinala que muito do trabalho acerca das bibliotecas digitais não aborda as questões arquivísticas de garantia de armazenamento e acesso a longo prazo. Paralelamente, os arquivos digitais abarcam as funções das bibliotecas digitais no que se refere à selecção, obtenção, armazenamento, e fornecimento de acesso à informação digital. Muitos dos requisitos por eles definidos para arquivos digitais justapõem-se aos das bibliotecas digitais.174 Face a esta distinção entre estes dois tipos de repositórios, considero importante introduzir algumas definições fornecidas pelo Modelo de Referência OAIS175, o qual será aprofundado no capítulo 4. Este documento de 2002, considera: “Open Archival Information System (OAIS) - an archive, consisting of an organization of people and systems, that has accepted the responsibility to preserve information and make it available for a Designated Community. (…) The information being maintained has been deemed to need Long Term Preservation, even if the OAIS itself is not permanent. Long Term is long enough to be concerned with the impacts of changing technologies, including support for new media and data formats, or with a changing user community. Long Term may extend indefinitely.”176 Estas definições são importantes porque, desde a sua emergência, tornaram-se incontornáveis, na medida em que a maioria dos documentos futuros passa a mencioná-las, mesmo que por comparação. É o caso do documento, já abordado, do RLG/OCLC, de 2002, o Trusted Digital Repositories: Attributes and Responsibilities: “OAIS Reference Model uses “digital archive” to mean the organization responsible for digital preservation; this paper uses “archive” in place of “repository” only when “archive” is taken directly from the OAIS Model.” 177 174 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. 8. 175 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): blue book. p. 1-1. 176 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. III. 177 BEAGRIE, Neil, [et al.] - Trusted digital repositories: attributes and responsibilities, p. 3. 47 Em 2003 é criada a Task Force on Digital da RLG-NARA (National Archive and Records Administration), que publica o Trustworthy Repositories Audit & Certification: Criteria and Checklist (TRAC) em 2007, e refere que os termos repositório digital e arquivo digital são muitas vezes utilizados de forma indistinta, sendo que o OAIS utiliza arquivo quando se refere a um organização que pretende preservar informação para acesso e utilização de uma Comunidade Designada, e que o documento Trusted Digital Repositories: Attributes and Responsibilities prefere o termo repositório digital. No entanto o TRAC defende que estes dois termos não se devem confundir seja com as bibliotecas digitais, que coligem e fornecem informação digital, mas que podem não se responsabilizar pela preservação a longo prazo, seja pelos arquivos de dados, que se comprometem com a preservação a longo prazo, mas que limitam as suas colecções a conjuntos de dados estatísticos.178 Esta será a mesma definição que a Cornell University Library utiliza no seu tutorial em linha, desde a sua criação em 2003.179 Assinalam assim a existência de uma equivalência entre Repositório Digital, usado pelo RLG/OCLC, e Arquivo Digital, tal como indicado no Modelo de Referência OAIS, e que diferenciam de Bibliotecas Digitais e Arquivos de Dados, definindo este conceitos. Neste ano, a Association of Research Libraries (ARL) marca o surgimento de repositórios institucionais como: “a new strategy that allows universities to apply serious, systematic leverage to accelerate changes taking place in scholarship and scholarly communication, both moving beyond their historic relatively passive role of supporting established publishers in modernizing scholarly publishing through the licensing of digital content, and also scaling up beyond ad-hoc alliances, partnerships, and support arrangements with a few select Faculty pioneers exploring more transformative new uses of the digital medium.” 180 Por seu lado a UNESCO, ainda em 2003, tentando escapar às ambiguidades no entendimento da definição dos conceitos de arquivo e repositório para os gestores de documentos de arquivo e para os especialistas das Tecnologias [Digitais] da Informação, invoca o termo Programa de Preservação, para substituir os termos arquivo digital e repositório digitais, no sentido de conjunto articulado de operações com o objectivo de preservar materiais digitais, e que inclui todas as responsabilidades da preservação, desde a política, a estratégia, até à execução.181 A equivalência entre Repositório Digital e Arquivo Digital é reforçada por Lavoie, que em 2004, afirmava que a definição de sistema de informação de arquivo no Modelo de Referência OAIS enfatiza as funções principais dos repositórios, a de preservar informação, ou seja, garantir a sua continuidade (persistência) a longo prazo, e a de fornecer acesso à informação arquivada 178 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 75. CORNELL UNIVERSITY LIBRARY; ICPSR; MIT LIBRARIES - Digital preservation management: implementing short-term strategies for long-term problems. 180 LYNCH, Clifford - Institutional repositories: essential infrastructure for scholarship in the digital age, p. 1. 181 WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage, p. 10. 179 48 de uma forma consistente com as necessidades dos utilizadores principais do OAIS, ou da Comunidade Designada.182 O mesmo autor (2005), especifica mais tarde que: “The OAIS information model is a conceptualization of the information objects taken into, stored, and disseminated by a digital preservation repository.”183 No Digital Repositories Review de 2005, o JISC, elabora sobre um conjunto de questões que reflectem a diversidade de significados que, até à data, tinham sido utilizados para o termo Repositórios Digitais, dos tipos de repositórios digitais existentes, e que características o distinguiriam dos outros tipos de colecções de objectos digitais: será o repositório gerido como um repositório institucional? Ou repositório temático? Qual o conteúdo do repositório? É um repositório de e-prints? Um repositório de dados? Um repositório de objectos de ensinoaprendizagem? Será o objectivo do repositório a preservação, acesso ou gestão de dados? 184 Assim defendem que o que caracteriza um repositório é o facto de o conteúdo ser depositado, seja pelo produtor, o proprietário ou por terceiros, da sua arquitectura gerir tanto o conteúdo como a metainformação, de ser capaz de oferecer um conjunto mínimo de serviços básicos, tais como a ingestão, disseminação, pesquisa e controlo de acesso, e, finalmente, ser sustentável e confiável, com um bom suporte e administração. Em 2005 Barbedo, abordando a questão dos Arquivos Digitais, considera que a Norma OAIS, embora chamada de Open Archival Information System, o seu espectro de aplicação não se limita ao material de arquivo, até porque, ao ser a base das experiências executadas por organizações ligadas à biblioteconomia no âmbito da preservação digital, o termo arquivo é deturpado. O autor considera, no entanto, que esta norma tem uma importância fulcral em termos terminológico-conceptuais, de princípios e métodos utilizados no desenvolvimento de repositórios de informação digital e à sua preservação e acessibilidade.185 Defende que, no sentido de definir o termo de Arquivo Digital é necessário complementar a definição fornecida pelo Modelo de Referência OAIS: “O Arquivo Digital é pois uma estrutura que compreende tecnologia, recursos humanos e um conjunto de políticas para incorporar, gerir e acessibilizar numa perspectiva continuada objectos digitais de natureza arquivística.”186 Paralelamente, Azevedo Pinto, e no âmbito de uma investigação que decorria em 2005 e que incidia sobre programas e projectos de gestão e preservação digital, evoca a seguinte dúvida: “Bibliotecas digitais, arquivos digitais, repositórios. Será nítida a fronteira? Onde começa um e acaba o outro?” 187 182 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 3. LAVOIE, Brain; GARTNER, Richard - Preservation metadata, v.1, p. 9. 184 HEERY, Rachel; ANDERSON, Sheila - Digital repositories review, p. 1. 185 BARBEDO, Francisco - Arquivos digitais: da origem à maturidade, p. 11-12. 186 BARBEDO, Francisco – Arquivos digitais: da origem à maturidade, p. 12. 187 PINTO, Maria Manuela Gomes de Azevedo – Do «efémero» ao «sistema de informação», p. 58. 183 49 Face a este panorama conceptual e terminológico, a autora constata: “a ocorrência do termo arquivo/repositório digital como elemento agregador de eprints, e-journals, e-mails, páginas web, ou simples registos de actos administrativos em bases de dados (…)”188 Esta investigação consistiu no levantamento efectuado por Azevedo Pinto, a nível mundial, de iniciativas, planos, programas e projectos desenvolvidos no período compreendido entre 1995 e 2007. Um dos âmbitos do levantamento era a identificação da percepção que os diversos promotores dessas acções tinham acerca do tipo de repositório que tinham em vista desenvolver, ou gerir, sendo que os valores identificados pela autora, por ordem decrescente, foram: repositório digital; vários; arquivo digital; biblioteca digital; repositório institucional; repositório cultural; arquivo; sítio web especializado; biblioteca; sítio web/plataforma de acesso; sítio web de referência; repositório de preservação; museu/sítios arqueológicos; repositório de e-learning.189 Neste âmbito a autora refere em 2009 que se verifica o domínio do termo repositório digital, que se sobrepõe aos termos de primeira vaga (arquivo e biblioteca digitais), e que, na sua opinião, engloba repositórios institucionais, de e-learning e culturais. Para a autora, e tendo em conta as necessidades de preservação, estes repositórios ultrapassam separações que, ela considera não terem fundamentação teórica, mesmo quando exista e esteja subjacente às acções mapeadas. Autora defende ainda que a posição emergente dos repositórios ligados ao e-learning e à preservação se deve à evolução das preocupações das comunidades de interesse nelas envolvidas.190 A autora sustenta ainda que o segundo lugar do tipo "vários" confirma a existência de parcerias e de consórcios de entidades com o fim de resolverem problemas comuns, mas sem conseguir encontrar necessidades de especificação ou evolução no que se prende com o tipo de sistema de informação que gerem e à sua (re)estruturação.191 Com base nisso refere a existência de uma diversidade e dificuldade de especificação de conceitos e dos termos que melhor os definem.192 Nesse sentido defende que a dificuldade em definir e distinguir entre biblioteca digital, arquivo digital, repositório institucional e a generalização do uso do termo repositório ligada ao surgimento de parcerias e consórcios com o fim de diminuir as diferenças institucionais, remetem para a "importância da inclusão da preservação na fundamentação epistemológicoteórica que sustenta a área científica da Ciência da Informação".193 Embora a opinião aqui veiculada não coincida com esta autora, e não sendo as questões epistemológicas o cerne deste trabalho, considero que a investigação referenciada constitui um estudo incontornável do estado da arte desse período. 188 PINTO, Maria Manuela Gomes de Azevedo – Do «efémero» ao «sistema de informação», p. 58. PINTO, Maria Manuela Gomes de Azevedo - Gestão da informação e preservação digital, p. 335. 190 PINTO, Maria Manuela Gomes de Azevedo - PRESERVMAP, p. 185. 191 PINTO, Maria Manuela Gomes de Azevedo - PRESERVMAP, p. 186. 192 PINTO, Maria Manuela Gomes de Azevedo - PRESERVMAP, p. 151. 193 PINTO, Maria Manuela Gomes de Azevedo - PRESERVMAP, p. 160. 189 50 Não é convincente o argumento de Manuela Pinto, particularmente quando especialistas das TI e com experiência teórico-prática no âmbito de repositórios digitais define, a nosso ver, clara e pertinente, repositórios digitais, tendo por consideração, os seus fins para os quais são utilizados.194 Outro exemplo que reforça claramente a nossa opinião surgem pela mão de José Carlos Ramalho, que já em 2007, perante a profusão de termos (Bibliotecas Digitais, Arquivos Digitais, Repositórios Digitais, Biblioteca Electrónica, Biblioteca Virtual), define e distingue as Bibliotecas Digitais dos Arquivos Digitais, considerando que estes últimos se diferenciam por conterem essencialmente fontes primárias de informação (cartas, processos judiciais, registos paroquiais, etc.) produzidos directamente por um indivíduo ou organização) em lugar das fontes secundárias normalmente encontradas numa biblioteca (livros, etc.), terem os seus conteúdos organizados em grupos, isto é, os itens são agrupados por proveniência (indivíduo ou instituição criador) e ordem original (ordem mantida pelo criador) e não catalogados individualmente como nas bibliotecas e terem conteúdos únicos, na medida em que os registos de um arquivo são únicos e não podem ser encontrados ou consultados noutro local que não seja o seu arquivo, enquanto um livro pode ser encontrado em várias bibliotecas.195 A ferramenta DRAMBORA (2007), que refere as diferentes acepções do termo Repositório Digital, aponta que a especificidade da definição dada pelo Modelo de Referência OAIS se prende com a manutenção da compreensibilidade do material digital a longo prazo, mas que a maioria dos repositórios tinha, à data, somente preocupações ligadas ao acesso e utilização a curto-médio prazo, não tendo recursos ou obrigações, ou responsabilidades para preservação a longo prazo, pelo que os critérios e atributos para certificação de repositórios não estão orientados para eles, mas podem-lhes ser úteis.196 De facto, também autoras como Astrid Recker197 e Julie Allinson198 verificam que muitos repositórios não reconhecem a preservação como a sua função principal, derivado do desconhecimento das ameaças e perdas que podem ocorrer no futuro e por considerarem mais premente a necessidade de aumentar o conteúdo nos repositórios. Em 2008 o Digital Preservation Europe (DPE), lança o PLATTER (Planning Tool for Trusted Electronic Repositories), que partindo de uma referência similar ao DRAMBORA, refere diferentes utilizações do termo Repositório Digital e que passam por identificar coleções digitais que implementam um modelo (OAIS) ou protocolo (OAI-PMH), ou uma organização responsável pela gestão de material digital para uma dada Comunidade Designada de utilizadores finais, ou, finalmente, um conjunto de serviços ligados à aquisição, gestão e disseminação de material digital, de especial relevância quando os serviços são geridos por várias instituições que trabalham numa estrutura federada.199 De igual forma, reconhecem a existência de repositórios de vários tipos, e que terão interesse no seu documento: 194 Cf. FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital. RAMALHO, José Carlos - Repositórios digitais. 196 MCHUGH, Andrew [et al.] – DRAMBORA, p. 10. 197 RECKER, Astrid - The preservation of digital objects in german repositories, p. 7. 198 ALLINSON, Julie - OAIS as a reference model for repositories: an evaluation, p. 4-5. 199 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 8. 195 51 “common to repositories of many types – for example national libraries and archives, institutional repositories, subject-based repositories and scientific data archives.”200 Astrid Recker (2010) defende que o termo “repositório” é ambíguo, pelo que os repositórios considerados como tal pelos vários documentos com critérios de certificação de repositórios, são arquivos digitais de longo prazo, e que um subgrupo desses arquivos digitais podem ser repositórios temáticos ou institucionais. No entanto, estes podem não ter capacidade ou vontade de fornecer serviços de preservação a longo prazo, sendo assim arquivos de curto ou médio prazo, em que o termo "arquivo" é visto como uma coleção de informação.201 Em 2011 o CCSDS publica o Audit and Certification of Trustworthy Digital Repositories, onde se enfatiza, mais uma vez, a relação entre os termos Repositório Digital e Arquivo Digital, enquanto repositórios com responsabilidades e funcionalidades de preservação a longo prazo. Outro elemento distintivo face aos outros repositórios prende-se com as necessidades (e expectativas) da Comunidade de Interesse, que pode ser uma única e generalista, ou então podem ter várias comunidades designadas, como necessidades altamente especializadas, cada uma necessitando de diferentes funcionalidades ou apoio do repositório.202 Apesar desta aparente ambiguidade, surge no panorama internacional, intimamente relacionados com os esforços de certificação e garantia de fidedignidade nos repositórios, propostas que permitem a identificação tipológica e caracterização dos repositórios digitais, por parte dos mesmos. Nesse sentido, o PLATTER (2008) apresenta, no âmbito da planificação das finalidades, objectivos, e metas de desempenho, uma abordagem que permite caracterizar o repositório em termos de Objectivo e Funções, Dimensão, Funcionamento e características do material custodiado, soluções técnicas e implementações escolhidas.203 Outras propostas ligadas a projectos e grupos de trabalho com valências similares serão apresentadas nos capítulos 4 e 5. Em Janeiro de 2007, o Center for Research Libraries (CRL) organizou uma reunião de projectos de desenvolvimento de normas e mecanismos de apoio à auditoria, certificação e acreditação de repositórios. Esta reunião, em que também participaram o Digital Curation Center (DCC), o Digital Preservation Europe (DPE) e o NESTOR (Network of Expertise in Long-term STOrage of Digital Resources) resultou no desenvolvimento de um conjunto comum de critérios que todos os repositórios de preservação digital devem seguir, independentemente da sua missão, modelo de negócio e fonte de financiamento.204 Estes serão apresentados no capítulo 5. 200 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 10. 201 RECKER, Astrid - The preservation of digital objects in german repositories: three case studies, p. 10. 202 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book, p. 1-4. 203 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 10. 204 Cft. CENTER FOR RESEARCH LIBRARIES (CRL) - Ten principles; MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment – DRAMBORA, p 16. 52 Em 2012 é publicado em Portugal o relatório Estado da Arte em Preservação Digital205, no âmbito do projecto Repositório Científico de Acesso Aberto de Portugal (RCAAP), que faz uma panorâmica geral do tema da preservação digital, e contextualizando-o no âmbito dos repositórios de acesso aberto. O autor refere ainda a existência de um debate entre os que defendem a importância da preservação nos repositórios para aumentar a sua fidedignidade e aqueles que defendem a prioridade em aumentar o volume de conteúdos, considerando os repositórios como apenas um meio de acesso, de entre vários, e que a preservação deve ser assumida pelos editores dos artigos científicos.206 Repositórios de Acesso Aberto Numa abordagem muito sintética acerca dos Repositórios de Acesso Aberto, apoiamo-nos na explicação de Mary M. Case (2003), segundo a qual a Open Archives Initiative (OAI) desenvolve e promove normas de interoperabilidade que pretendem facilitar a disseminação dos conteúdos. O OAI Metadata Harvesting Protocol permite que serviços de terceiros recolham metainformação normalizada de vários repositórios e efectuem pesquisas sobre a Metainformação angariada para identificar e recuperar documentos. Para autora, embora muitos partidários do OAI defendam o acesso livre, (ou seja, a existência de obras gratuitas na Internet), o enquadramento e as normas tecnológicas fundamentais do OAI são independentes tanto do tipo de conteúdo oferecido, como dos modelos económicos que envolvem esse conteúdo.207 O Protocolo Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) é um protocolo desenvolvido pela Open Archives Initiative a partir de 1999, utilizado para distribuir e recolher metainformação principalmente no que concerne a descritores de documentos. Neste âmbito, Miguel Ferreira208 refere que os repositórios de acesso aberto foram inicialmente concebidos como um modo de fornecer acesso imediato e amplo a trabalhos de investigação científica, mas têm vindo a assumir o papel de curadores dessa produção científica, obrigando à adopção de políticas e ferramentas específicas para a sua preservação e curadoria. O autor indica que o primeiro repositório de acesso aberto, o arXiv, surge no início da década de 90 do século passado nos EUA e foi concebido inicialmente como um arquivo para preprints.209 Repositórios Institucionais e/ou Temáticos Não querendo cingir-nos somente ao repositório digital como “Arquivo Digital” dedicado à preservação a longo prazo, e por considerarmos que a abordagem acerca dos repositórios digitais não ficaria completa sem elucidar sobre as especificidades Repositórios Institucionais e 205 206 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital. FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 7- 8. 207 CASE, Mary – Framing the issue: open access, p. 10. FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 26. 209 Preprints refere-se ao texto digital de um artigo que ainda não foi avaliado e revisto por pares (peerreviewed) e ainda não foi aceite para publicação por uma revista científica. 208 53 as Bibliotecas Digitais tentaremos analisar estudos de autores que se debruçaram sobre esta área. Segundo Miguel Ferreira, a generalização do uso de tecnologias digitais nas universidades e centros de investigação e as alterações que têm decorrido nas formas de armazenamento, acesso e partilha da informação das actividades científicas, desde dados primários até artigos de revistas, levaram a um crescimento de dimensão e complexidade, em sintonia com a evolução do meio científico. Pela importância e valor dessa informação, ela deve ser preservada para garantir a maximização no investimento, a reutilização do conhecimento, garantir a sua fiabilidade e para conservar a memória organizacional.210 O Relatório da Task Force on Archiving of Digital Information CPA/RLG, 1996 refere que as instituições de investigação científica e académicas necessitam de uma infrastrutura apropriada capaz de apoiar um sistema de arquivos digitais: “Long-term preservation of digital information on a scale adequate for the demands of future research and scholarship will require a deep infrastructure capable of supporting a distributed system of digital archives.”211 Crow (2002) define repositórios institucionais como colecções digitais que capturam e preservam os resultados da produção intelectual das comunidades universitárias. Para este autor estes repositórios são essenciais para estimular a inovação nas comunicações nas áreas académicas e como indicador da qualidade da instituição, medida em termos de visibilidade, prestígios e valor para o público.212 Esta ideia é corroborada por Lynch (2003), que considera, como já vimos anteriormente, que o desenvolvimento de repositórios digitais se trata de uma nova estratégia que permite às universidades aplicar uma alavancagem séria e sistemática que acelere as mudanças que têm vindo a ocorrer na comunicação académica e de investigação, que estão a ultrapassar o seu papel historicamente passivo de apoio aos editores já estabelecidos, ao modernizar as publicações académicas pelo licenciamento de conteúdo digital, e ir para além das alianças e parcerias ad-hoc e apoiar acordos com algumas Faculdades pioneiras na exploração de novas utilizações mais transformadoras do suporte digital.213 Este autor apresenta a seguinte definição: “…a university-based institutional repository is a set of services that a university offers to the members of its community for the management and dissemination of digital materials created by the institution and its community members. It is most essentially an organizational commitment to the stewardship of these digital 210 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 26. WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. 40. 212 CROW, Raym - The case for institutional repositories: a SPARC position paper, p. 2. 213 LYNCH, Clifford - Institutional repositories: essential infrastructure for scholarship in the digital age, p. 1. 211 54 materials, including long-term preservation where appropriate, as well as organization and access or distribution.”214 Nesse mesmo ano, e mais concretamente no Brasil, Café, juntamente com Arellano e outros (2003), defendem que: “Um repositório institucional é a reunião de todos os repositórios temáticos hospedados em uma organização.” 215 Arellano (2008) irá mais tarde diferenciar vários tipos de repositórios digitais, avançando com definições para cada um deles: os repositórios temáticos dizem respeito a uma área do conhecimento; os repositórios institucionais são sistemas de informação que armazenam, preservam e disseminam a produção intelectual das instituições e comunidades científicas em formato digital; os repositórios centrais fornecem serviços de reunião de dados coligidos de bibliotecas digitais, repositórios temáticos e repositórios institucionais, a nível nacional ou internacional.216 Curiosamente Kingsley217 (2008) e Astrid Recker218 (2010) diferenciam repositórios institucionais e repositórios temáticos. O primeiro autor refere que nos repositórios institucionais, as políticas de selecção e retenção de material, bem como o foco e organização geral do repositório, é determinado pela instituição, enquanto nos repositórios temáticos as políticas de depósito são determinadas pelas comunidades de investigação. A autora alemã reforça esta ideia considerando que os repositórios institucionais e temáticos diferem na aceitação que têm por parte das respectivas comunidades alvo. Ela considera também que a definição de repositórios institucionais de Lynch também se aplica aos repositórios temáticos, excepto que estes prestam serviços a uma comunidade de académicos que não está delimitada institucionalmente, mas pelo seu trabalho na mesma área científica. Finalmente, ela considera que Salo219 (2007), muito embora não aborde os repositórios temáticos, detalha várias razões pelas quais os investigadores hesitam em depositar conteúdos em repositórios institucionais. Wheatley (2004) parte da definição repositórios institucionais dada por Lynch, considerando que: “The term institutional repository implies a community based service although this is interpreted by repository developers in different ways. Some embody a crosssubject, cross-department service which requires flexibility to meet the requirements of many different types of users. Some focus more specifically on a 214 LYNCH, Clifford - Institutional repositories: essential infrastructure for scholarship in the digital age, p. 2. 215 CAFÉ, L., [et al.] - Repositórios institucionais: nova estratégia para publicação científica na rede, p. 13. MÁRDERO ARELLANO, Miguel - Critérios para a preservação digital da informação científica, p. 124. 217 KINGSLEY, Danny - Those who don’t look don’t find: disciplinary considerations in repository advocacy, p. 3. 218 RECKER, Astrid - The preservation of digital objects in german repositories: three case studies, p. 10. 219 SALO, Dorothea - Inkeeper at the roach motel. 216 55 particular subject and possibly type of material to be archived, while still delivering an institution-wide service.”220 O autor considera que, muito embora o termo repositório institucional sugira um contexto de ensino superior, nem sempre é o caso, visto que as instituições com necessidades de armazenamento, preservação e fornecimento de acesso a materiais digitais podem necessitar de ter os seus próprios repositórios, algo que, para o autor, será cada vez menos incomum. Para ele, o termo repositório institucional pode referir-se simplesmente a uma instância de um repositório institucional ou ao software que torna possível a existência do repositório institucional.221 O JISC, no Digital Repositories Review 2005, apoiando se em Lynch, considera que um dos principais motores para criação de repositórios, sejam repositórios institucionais ou repositórios temáticos, é a melhoria do acesso na comunicação a nível académico. Nesse âmbito defendem que os repositórios devem suportar o "acesso aberto". Para eles, os Repositórios de Acesso Aberto distinguem-se por fornecer acesso aberto ao seu conteúdo (a menos que haja limitações legais) e à metainformação para extracção (colheita) [Harvest].222 Na óptica do Repositories Support Project (RSP) os repositórios digitais têm um grande potencial para serviços de valor agregado e oferecem um leque de benefícios aos investigadores, instituições, e comunidade de investigação a nível global. Para eles, os repositórios de acesso aberto oferecem vantagens adicionais, ao recolher os resultados da investigação científica que já foram pagos e torná-los acedíveis em linha e gratuitamente, o que é vantajoso para autores, investigadores, instituições e para o processo de investigação, na medida em que permite uma melhor gestão dos resultados dos produtos intelectuais e libertar (leia-se facilitar) o processo de disseminação.223 O documento do JISC revela ainda que um número significativo de registos em repositórios institucionais são compostos apenas por metainformação, sem qualquer ligação ao texto completo. Isto parece ser devido ao cuidado especial relativamente a direitos de autor e direitos de propriedade intelectual. Os administradores de repositórios e os autores têm relutância em entrar em conflito com os editores sobre direitos de autor por isso não incluem texto completo, quando houver dúvida sobre direitos de autor. Além disso, alguns repositórios apenas incluem hiperligações para o texto completo para as entradas publicadas e / ou de autoria, enquanto o autor fizer parte da instituição.224 Para o JISC, outro elemento que diferencia os repositórios das outras colecções, são as motivações subjacentes à sua criação, na medida em que resultam de um cruzamento de interesses de diferentes comunidades de prática: bibliotecas digitais, pesquisa, aprendizagem, e-ciência, edição, gestão documental, preservação. A motivação do foco nos repositórios difere nessas comunidades, e os serviços essenciais que os repositórios podem proporcionar 220 WHEATLEY, Paul - Institutional repositories in the context of digital preservation. WHEATLEY, Paul - Institutional repositories in the context of digital preservation. 222 HEERY, Rachel; ANDERSON, Sheila - Digital repositories review, p. 2. 223 JISC – Benefits. In Repositories Support Project (RSP). 224 HEERY, Rachel; ANDERSON, Sheila - Digital repositories review, p. 13. 221 56 variam ao longo de áreas que passam pela melhoria do acesso aos recursos, por novas modalidades de publicação e revisão por pares, pela gestão da informação organizacional (sistemas de gestão de documentos de arquivo e de gestão de conteúdo), pela partilha de dados (reutilização dos dados de investigação e dos objectos de aprendizagem), e pela preservação dos recursos digitais. Sustentam esta ideia atentando à definição dada por Lynch que, segundo eles, denota uma ênfase na importância desses serviços e não num produto de software ou tipo de conteúdo específico.225 O JISC226 sugere ainda uma simples tipologia de repositórios:  por tipo de conteúdo, onde engloba dados primários de pesquisa, dados de pesquisa derivados, artigos académicos pré-publicados, artigos avaliados pelos pares em versões finais de revistas ou actas de conferências, teses em formato electrónico, publicações originais como relatórios técnicos institucionais ou departamental, objectos de ensinoaprendizagem, documentos de arquivo da organização, como processos de alunos e de funcionários, licenças, etc.;  por área de cobertura, que pode ir desde o pessoal (arquivo pessoal do autor), revista (o resultado do produto de uma revista ou grupo de revistas), até departamental, institucional, interinstitucional (regional), nacional e mesmo internacional;  por função principal do repositório, que inclui o realce no acesso aos recursos (pesquisa e localização de recursos), acesso aos recursos por temas; preservação de recursos digitais; novas formas de disseminação (ou publicação), gestão de bens da instituição, e partilha e reutilização de recursos;  por grupo de utilizadores alvo, que vai desde os discentes aos professores e investigadores. Na esteira de Crow, Helen Hockx-Yu (2006) sustenta que um repositório institucional armazena e torna acessível os bens educacionais, de pesquisa e associados de uma instituição, e que embora a maioria dos repositórios institucionais existentes à data eram repositórios de publicações electrónicas [e-prints] que fornecem acesso aberto aos resultados da investigação científica da instituição, o seu conteúdo não tem que se limitar a esses artigos publicados, podendo incluir dados primários de pesquisa, materiais de ensino-aprendizagem e outros tipos de conteúdo.227 A autora considera a falta de consenso quanto ao nível de responsabilidade que os repositórios digitais devem ter pela preservação na medida em que alguns defendem que os fins dos repositórios institucionais de acesso aberto se limitam ao acesso, utilização e impacto, por considerarem que a preservação dos artigos científicos da instituição que foram publicados é uma responsabilidade da editora e das bibliotecas de depósito legal, não devendo ser assim, uma motivação para o arquivo desses materiais. Do outro lado, surgem os 225 HEERY, Rachel; ANDERSON, Sheila - Digital repositories review, p. 2. HEERY, Rachel; ANDERSON, Sheila - Digital repositories review, p. 13-14. 227 HOCKX-YU, Helen – Digital preservation in the context of institutional repositories, p. 1. 226 57 defensores da preservação a longo prazo como uma das funções que deve ser abordada logo de início pelos repositórios institucionais.228 Arellano (2008) apoia-se em Lynch, ao afirmar que as universidades, por todo o mundo, têm adoptado esta forma de publicação para divulgar os resultados das pesquisas científicas e desenvolvem políticas institucionais para legitimação dos seus repositórios de acesso aberto como detentores de produção científica reconhecida.229 Por sua vez Carla Ferreira (2011) baseia-se em Lynch230 no contexto da infrastrutura dos repositórios digitais, indicando que no contexto da preservação, estes fornecem mecanismos para identificação persistente dos documentos, uniformização de formatos e atribuição de metainformação descritiva, de localização, gestão de direitos de autor e das alterações sobre os documentos, acções estas que são garantia de uma boa gestão das mudanças tecnológicas, aplicação de estratégias de preservação e automatização de processos. A autora dá o exemplo da migração, que assim se torna mais simples, rápida e menos dispendiosa quando aplicada a documentos com características comuns.231 Miguel Ferreira (2012) refere que se verifica, tanto a nível nacional como a nível externo, a existência de repositórios institucionais que recolhem uma grande percentagem da produção científica dos seus membros, informação essa que não é publicada externamente, pelo que os repositórios se tornam o local original, principal e mesmo único de publicação, defendendo por isso que a preservação digital deve ser uma preocupação futura destes repositórios.232 Este autor refere ainda que após o surgimento das plataformas para repositórios desenvolveram-se ferramentas de preservação, que vão desde a elaboração de planos de preservação, políticas de extracção de metainformação de preservação de ficheiros, juntamente com arquitecturas que permitem a ligação modular destas ferramentas. Para o autor, a diversidade de projectos e iniciativas que têm decorrido neste domínio demonstram o aumento da notoriedade e relevância que tem tido a preservação e curadoria no contexto dos repositórios institucionais.233 Ernesto Candeias Martins234 (2013) considera o Repositório como imagem de marca e objecto de aprendizagem em meio digital. Parte do conceito de ‘repositório’ como lugar onde se guarda algo, armazena Dados e/ou trabalhos científicos em rede informática / sistema digital. Neste âmbito a utilidade do Repositório Científico repousa na actividade de aprender e partilhar. Para o autor, os repositórios são lugares criados para depositar / armazenar os objectos de aprendizagem que demonstram ter qualidade de conteúdos, uma adequação dos 228 HOCKX-YU, Helen – Digital preservation in the context of institutional repositories, p. 3. MÁRDERO ARELLANO, Miguel - Critérios para a preservação digital da informação científica, p. 124125. 230 LYNCH, Clifford - Institutional Repositories: Essential Infrastructure for Scholarship in the Digital Age, p. 6-7. 231 FERREIRA, Carla - Preservação da Informação Digital : uma perspectiva orientada para as bibliotecas, p. 72. 232 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 8. 233 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 29. 234 MARTINS, Ernesto - O repositório: imagem de marca e objeto de aprendizagem em meio digital. 229 58 objectivos, uma retroalimentação e adaptabilidade, capacidade de motivar e gerar interesse em quem pesquisa. O repositório online pretende consolidar competências na procura/busca de objectos de aprendizagem, efectivar a socialização activa entre investigadores, docentes, alunos e utentes da comunidade educativa, tendo relevância no contexto das instituições do ensino superior. O Repositório será o objecto de aprendizagem nas bibliotecas digitais especializadas, onde se deposita e se gere os recursos digitais. O autor considera ainda os repositórios institucionais, que diz serem sítios na Web que recolhem, preservam e difundem a produção científica académica duma instituição, permitindo o acesso a objectos digitais que contêm, com os seus meta-dados. O objectivo destes repositórios é favorecer a difusão dos conteúdos académicos da instituição, dar visibilidade à investigação realizada na instituição pelos seus membros, facilitar a conservação e preservação dos objectos documentais criados, armazenados e organizados. Trata-se de uma forma de difusão nos sistemas digitais de difundir a sua produção científica por áreas de conhecimento. Bibliotecas Digitais O termo Biblioteca digital foi utilizado pela primeira vez em 1994 pela Digital Libraries Initiative da NSF (National Science Foundation), DARPA (Defense Advanced Research Projects Agency) e NASA (National Aeronautics and Space Administration).235 De acordo com Candela (2011): “Vannevar Bush236 devised “a device in which an individual stores all his books, records, and communications, and which is mechanized so that it may be consulted with exceeding speed and flexibility.”237 Arms (2000) 238 define bibliotecas digitais como: “a managed collection of information, with associated services, where the information is stored in digital formats and accessible over a network. A key part of this definition is that the information is managed. (…) Digital libraries contain diverse collections of information for use by many different users.” O autor identifica semelhanças e diferenças entre as bibliotecas digitais e as bibliotecas ditas tradicionais: ” In some ways, digital libraries are very different from traditional libraries, yet in others they are remarkably similar.(…) They still create information that has to be organized, stored, and distributed. They still need to find information that others have created, and use it for study, reference, or entertainment. However, the form 235 FOX, Edward - The digital libraries initiative - update and discussion. BUSH, Vannevar - As we may think. 237 CANDELA, Leonardo; CASTELLI, Donatella; PAGANO, Pasquale - History, evolution and impact of digital libraries, p. 2. 238 ARMS, William - Digital libraries. 236 59 in which the information is expressed and the methods that are used to manage it are greatly influenced by technology and this creates change.” Para além disso enumera ainda um conjunto de aspectos positivos decorrentes das bibliotecas digitais, na medida em que facilitam e aumentam a utilização da biblioteca sem ter que sair da secretária, estando apenas dependentes de um computador e rede, que são utilizados para pesquisa e descoberta da informação, que podem ser partilhadas e disponibilizadas a todos, sem custos de duplicação física ou de inacessibilidade. A informação pode actualizar-se facilmente e leva ao surgimento de novos tipos de informação, como bases de dados, que podem registar e disseminar informação passível de ser analisada e manuseada de uma maneira melhor e mais fácil do que a pesquisa em suporte papel. A DELOS, uma rede de excelência sobre Bibliotecas Digitais parcialmente financiada pela Comissão Europeia no quadro do Programa de Tecnologias da Sociedade da Informação, produziu em 2001, um Brainstorming Report em que defende que: “Digital libraries should enable any citizen to access all human knowledge any time and anywhere, in a friendly, multi-modal, efficient, and effective way, by overcoming barriers of distance, language, and culture and by using multiple Internet-connected devices.”239 Na sua perspectiva: “The potential exists for digital libraries to become the universal knowledge repositories and communication conduits of the future, a common vehicle by which everyone will access, discuss, evaluate and enhance information of all forms. Furthermore, we see the potential for digital libraries to become the strongest shield of humanity protecting its historic, cultural and scientific artefacts from time, natural disasters, thieves, vandals and terrorists.”240 Saramago(2003), baseando-se na rede DELOS, define Biblioteca digital como: “uma colecção de recursos electrónicos de informação proveniente de uma variedade de fontes, incluindo a Web.”241 A autora refere que são estruturas de bibliotecas digitais cuja criação espelha os modelos das bibliotecas convencionais, museus, arquivos e repositórios digitais, e que podem armazenar qualquer tipo de recurso digital, cumprindo com as funções de divulgação e acesso a longo prazo.242 Saramago parte das orientações dadas pela rede DELOS, para definir uma biblioteca digital quanto aos seus objectivos, que são a oferta de serviços integrados para acesso a recursos em 239 DELOS ASSOCIATION - Digital libraries: future directions for a european research programme, p. 5. IOANNIDIS, Yannis - Digital libraries at a crossroads, p. 265. 241 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: Estado da Arte e Boas Práticas em Repositórios Digitais, p. 10. 242 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: Estado da Arte e Boas Práticas em Repositórios Digitais, p. 16. 240 60 colecções culturais ou científicas, podendo basear-se em sistemas tradicionais ou em novas estruturas que aproveitam as potencialidades do ambiente tecnológico.243 De acordo com a autora, a funcionalidade dos serviços integrados assenta em pressupostos como as necessidades de informação de grande qualidade, que esteja relacionada em fontes diversas e dispersas, que seja heterogénea, cujas fontes sejam ricas e fiáveis, seja multimédia, e com uma comunidade de utilizadores definida, e composta por utilizadores motivados. A orientação deve ser dada por domínios do conhecimento, com acessos em várias línguas, e sempre baseada no espírito colaboração que se consubstancie em protocolos de cooperação. Quanto aos propósitos e tempo de vida, Saramago refere que as bibliotecas são procuradas no âmbito da investigação e aprendizagem, devendo fornecer acesso a informação preservada a médio-longo prazo, de acordo com as necessidades dos utilizadores.244 Borbinha (2004), no âmbito da iniciativa BND – Biblioteca Nacional Digital245 da BN – Biblioteca Nacional de Portugal, identifica os principais problemas no depósito de obras digitais em bibliotecas patrimoniais, no âmbito de conteúdos concebidos apenas para a Internet, muitas vezes assentes em sistemas de publicação digital complexos e sofisticados, no âmbito de conteúdos concebidos para distribuição tanto pela Internet como pelos meios tradicionais, produzidos em ambiente digital mas de complexidade menor que os anteriores, e no âmbito de conteúdos concebidos somente para distribuição tradicional, como a impressão, mas que a parte final do processo é desenvolvida recorrendo a processos digitais.246 O autor chega mesmo a defender que: “na realidade toda a informação e conteúdos que circulam hoje em dia na nossa sociedade existiram algures em formato digital. Levando esta constatação às suas últimas consequências, devemos então reconhecer que os problemas do depósito e preservação digital não devem ser encarados já como uma excepção, mas talvez como a regra.”247 Arellano (2008) defende que a relação e especificidades entre as bibliotecas digitais e os repositórios digitais, definindo ambos os termos, considerando os repositórios digitais como responsáveis colectivamente pela garantia da integridade e acesso de longo prazo do património da sociedade, por intermédio de estratégias de preservação, enquanto que a biblioteca digital é um repositório que colige e fornece acesso à informação digital, sem a obrigação de garantir o armazenamento a longo prazo e o acesso à informação, pelo que, em seu entender, muitas bibliotecas digitais podem ou não ser repositórios digitais, mas os repositórios digitais realizam algumas funções da biblioteca digital (selecção, obtenção, 243 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: Estado da Arte e Boas Práticas em Repositórios Digitais, p. 16. 244 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: Estado da Arte e Boas Práticas em Repositórios Digitais, p. 17. 245 PORTUGAL. Biblioteca Nacional – BND: Biblioteca Nacional Digital. 246 BORBINHA, José – Depósito e preservação na Biblioteca Nacional Digital, p. 1. 247 BORBINHA, José – Depósito e preservação na Biblioteca Nacional Digital, p. 1. 61 armazenamento e fornecimento de acesso), pelo que pode ser considerados parte da infraestrutura de serviços das bibliotecas digitais.248 Este autor, apoiando-se em Arms (2000), refere que uma biblioteca digital pode incluir sistemas de software aplicacional para estruturar uma colecção digital, gerindo e administrando os recursos digitais antes do seu depósito e publicação. Tais ferramentas influenciam a forma de preservação dos documentos e custos associados. A gestão dos sistemas informáticos das bibliotecas digitais não se limita às funções e actividades das bibliotecas tradicionais (aquisição, selecção, classificação, armazenamento), incluindo as questões ligadas à interoperabilidade dos acervos digitais em termos de arquitecturas, metainformação, e formatos normalizados, que já são tidas em conta no desenvolvimento destes sistemas para fins e comunidades específicas.249 Em 2011 é publicado um Modelo de Referência da Biblioteca Digital, no contexto de uma parceria entre a DELOS e a DL.org: Coordination Action on Digital Library Interoperability, Best Practices and Modelling Foundations, que define: Biblioteca Digital, Sistema de Biblioteca Digital e Sistema de Gestão de Biblioteca Digital. Assim, para eles, Biblioteca digital é uma organização potencialmente virtual, que colecta, gere e preserva a longo prazo, de forma aprofundada, conteúdos digitais enriquecidos, e que oferece funcionalidades especializadas sobre esse conteúdo às comunidades de utilizador alvo, com qualidade especificada de acordo com políticas definidas aprofundadamente. Um sistema de biblioteca digital é um sistema software baseado numa arquitectura para distribuição e que fornece todas os elementos necessários para uma biblioteca digital. Os utilizadores interagem com uma biblioteca digital através do respectivo sistema de biblioteca digital. O sistema de gestão de biblioteca digital é um sistema genérico de software que fornece a infrastrutura de software apropriada para produzir e administrar um sistema de biblioteca digital que incorpora o conjunto de funcionalidades consideradas fundamentais para as bibliotecas digitais, e integrar software adicional que forneça funcionalidades mais refinadas, especializadas ou avançadas.250 Para Carla Ferreira (2011) uma das missões das bibliotecas é a preservação da memória colectiva, garantindo o acesso às gerações futuras da documentação literária e científica, pelo que a preservação digital deve ser considerada uma actividade complementar aos serviços prestados pelas bibliotecas, numa perspectiva diferente da preservação tradicional, em que a gestão das colecções digitais assume uma importância maior no âmbito da gestão das colecções.251 A autora, baseando-se em Gladney, refere que a maioria dos bibliotecários considera que a preservação digital incorre em problemas que passam pela incapacidade de definir por onde começar a acção, pela falta de conhecimentos especializados, a inexistência de ferramentas confiáveis e de fácil utilização, e também a incapacidade de determinar custos.252 248 MÁRDERO ARELLANO, Miguel - Critérios para a preservação digital da informação científica, p. 124. MÁRDERO ARELLANO, Miguel - Critérios para a preservação digital da informação científica, p. 122. 250 CANDELA, Leonardo [et al.] - The digital library reference model, p. 17. 251 FERREIRA, Carla - Preservação da informação digital: uma perspectiva orientada para as bibliotecas, p. 17. 252 Cft GLADNEY, Henry – Preserving digital information, p. 44. 249 62 Mas a autora considera que, apesar disso, o contexto digital não pode ser sinónimo de ameaça, mas uma oportunidade para as bibliotecas, se redefinirem e assumirem-se como instituições incontornáveis da Sociedade da Informação. As tecnologias da informação ajudarão a cumprir a sua missão de fornecimento de acesso e preservação da informação, aumentando e melhorando a sua disseminação, devendo para tal identificar os problemas que a informação digital coloca aos processos de preservação.253 Witten em 2010 define bibliotecas digitais como: “focused collections of digital objects, including text, video and audio, along with means for access and retrieval, and for selection, organization and maintenance.”254 Perla Innocenti ao propor, em 2011, uma abordagem holística da interoperabilidade de políticas em bibliotecas digitais e repositórios digitais, afirma: “(…)without a policy framework a digital library is little more than a container for content.”255 Para concluir o Estado da Arte dos Repositórios Digitais É inegável a constatação de que os repositórios digitais, ao garantir o armazenamento e autenticidade dos conteúdos digitais, se tornam o cerne da preservação desses conteúdos. De igual forma, considera-se que a verdadeira distinção quanto à nomenclatura e utilização de repositórios digitais só poderá ser feita através dos documentos de política e estratégia de cada um, numa lógica de transparência e garantia de fidedignidade em relação aos seus agentes e utilizadores. Miguel Ferreira em 2012 verifica que: “No panorama internacional, têm vindo a registar-se múltiplas atividades, iniciativas e projetos, em especial nos últimos cinco anos. São iniciativas com origens e âmbitos diversificados, desde projetos menor dimensão promovidos por grupos de investigação até projetos de grande dimensão internacional.”256 Estas actividades incluem iniciativas no âmbito da certificação de repositórios digitais, que serão abordadas nos capítulos 4 e 5, e outras também indicadas por Miguel Ferreira: o desenvolvimento de softwares e/ou plataformas de repositórios como o EPrints, DSpace e o Fedora Commons; projectos e arquitecturas de preservação para repositórios como o CASPAR, o CRiB, o PANIC, o PLANETS, o PRESERV e Keepit, o RepoMMan e REMAP, o Seamless Flow, o 253 FERREIRA, Carla - Preservação da informação digital: uma perspectiva orientada para as bibliotecas, p. 18. 254 WITTEN, Ian; BAINBRIDGE, David; NICHOLS, David - How to build a digital library, p. XVI. 255 INNOCENTI, Perla [et al.] - Towards a holistic approach to policy interoperability in digital libraries and digital repositories, p. 111. 256 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 44. 63 SHAMAN, o SHERPA DP, e o SCAPE; estratégias para a preservação em repositórios, como o Modelo de Referência OAIS e o PREMIS, o CAIRO; e Ferramentas que auxiliam no planeamento de preservação, como o AONS II, o PLATO, e o PRONOM ROAR. Mais recentemente, a União Europeia para os projectos de investigação europeus até 2020, está a introduzir políticas Open Access, onde os dados gerados pelos projectos podem ser armazenados em repositórios digitais.257 Para o autor, muito embora se verifique uma crescente consciencialização e interesse relativamente à preservação digital, são poucos os repositórios onde se verifique a existência de políticas, estratégias e acções de preservação formalizadas e consolidadas. Tal situação decorre da inexistência de enquadramento jurídico apropriado em termos de preservação digital, que defina, entre outros, responsabilidades em termos de preservação, curadoria e interoperabilidade entre repositórios.258 Nesse sentido Miguel Ferreira termina o relatório sugerindo linhas de orientação para promover e facilitar os processos de preservação e curadoria em repositórios de acesso aberto em Portugal, que passam pela constituição de grupos de interesse na área, análise a políticas, procedimentos e estratégias de preservação e que permitam identificar recursos e custos envolvidos, condicionalismos legais e éticos no âmbito dos repositórios digitais portugueses, produção de um projecto que visa dotar os repositórios com ferramentas para a preservação digital, cooperando com iniciativas e projectos revelantes para as boas práticas nesta área, produzir documentos e acções de sensibilização e formação e suporte, com casos exemplares (nomeadamente no que se refere à utilização de formatos de ficheiro que facilite a preservação d longo prazo), tanto para gestores de repositórios como responsáveis institucionais.259 257 Cft. UNIÃO EUROPEIA. Comissão - Guidelines on data management in Horizon 2020; UNIÃO EUROPEIA. Comissão - Guidelines on best practices for using electronic information; G8 SCIENCE MINISTERS STATEMENT: news story. 258 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 44; UNIÃO EUROPEIA. Comissão – Online survey on scientific information in the digital age. 259 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital, p. 4445. 64 4 - O Modelo OAIS Entre 1994 e 1996 o grupo de trabalho sobre preservação de informação digital patrocinado pela RLG e pela CPA começou a abordar a questão dos arquivos digitais sustentáveis. Este trabalho teve continuidade, pela mão da Consultative Committee for Space Data Systems (CCSDS), que dá origem a um projecto de elaboração de uma norma de armazenamento a longo-prazo de dados digitais gerados no âmbito das missões espaciais. O grupo de trabalho era constituído por representantes da NASA (Estados Unidos), do Centre National d'Études Spatiales (CNES) da França, do British National Space Centre (BNSC) do Reino Unido, e da Agência Espacial Europeia (ESA), entidades com experiência no tratamento, armazenamento, descrição e fornecimento de acesso de informação digital. A análise preliminar efectuada por esse grupo permitiu concluir que o problema, não sendo específico dos dados digitais das missões espaciais, devia ser integrado num trabalho de desenvolvimento de normas. Tal levou à reunião de um grande número de organizações, como arquivos, bibliotecas e empresas que lidavam com a problemática da preservação da informação digital. Por outro lado, a investigação, análise e feedback nesta área revelaram a necessidade de um entendimento comum que desse origem a um modelo de referência conceptual, terminológico e funcional que fosse consensual. Neste âmbito em 2002, foi definido, como recomendação do CCSDS, o Modelo de Referência para um Sistema de Informação Aberto de Arquivo, ou simplesmente Modelo OAIS. O termo "aberto" significa que a norma foi desenvolvida num fórum aberto a todas as comunidades 260; tal não quer dizer que não haverá restrições de acesso à informação arquivada. Esta recomendação do CCSDS foi publicada no ano seguinte como a Norma ISO 14721:2003. Em 2012 é publicada uma versão revista pela CCSDS, agora como Prática Recomendada261, com o apoio de onze entidades-membro e 28 entidades observadoras, e que dá origem à ISO 14721:2012. O modelo OAIS fornece uma visão coerente do problema do arquivo e da preservação digital, definindo um conjunto de conceitos e funções que são os elementos básicos essenciais para a sua compreensão. Para tal apresenta uma terminologia completa que não se destina a substituir terminologias existentes, mas pretende manter o modelo num nível geral de abstracção independente de qualquer contexto de aplicação específico, para torná-lo reutilizável e aplicável a todas as áreas, sectores e tipos de informação digital. De acordo com Saramago (2003), esta terminologia neutra visa facilitar o intercâmbio entre os diferentes actores262 e definir as diferentes responsabilidades entre esses actores. O arquivo é definido neste modelo como "uma organização encarregada de preservar informação para permitir o acesso e utilização por parte de uma comunidade-alvo de 260 LAVOIE, Brain - The open archival information system reference model: introductory guide, p. 3; EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): blue book. 261 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book. 262 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais, p. 58. 65 utilizadores.263 Reconhece-se nesta definição as funções principais dos repositórios de arquivo, a conservação e a comunicação da informação264, mas salienta a necessidade de garantir a sua inteligibilidade, e, portanto, a sua usabilidade. Resumindo, e de acordo com Lavoie, o uso do termo OAIS, ou do termo arquivo no contexto do modelo OAIS, refere-se a um sistema de arquivo dedicado à preservação e disponibilização de informação digital a longo prazo, bem como o cumprimento de seis responsabilidades ou obrigações265, que serão abordadas com mais profundidade no capítulo 5. O modelo de referência OAIS consiste em três partes distintas, porém relacionadas, centradas em torno do conceito de um arquivo tipo OAIS. A primeira parte descreve o ambiente externo no qual o OAIS opera; a segunda parte descreve as entidades funcionais ou mecanismos internos, que cumprem, de forma colectiva, as responsabilidades de preservação do OAIS. A terceira parte descreve os objectos de informação que são ingeridos, geridos, e disseminados pelo OAIS.266 O Modelo de Ambiente Externo O modelo de ambiente externo que rodeia o Arquivo OAIS é composto por três intervenientes com os seguintes papéis267, a saber: Produtor OAIS (arquivo) Consumidor Administrador Figura 3 - O Modelo de Ambiente de um OAIS  O produtor, que fornece a informação a preservar. As interacções entre o OAIS e o produtor são definidas num Acordo de Submissão de informação entre as duas entidades, e que identifica os Pacotes de Submissão de Informação (SIP) com os dados que o produtor solicita que sejam preservados no OAIS, juntamente com a metainformação associada268, o 263 Cft. “an organization (…) of people and systems that has accepted the responsibility to preserve information and make it available for a Designated Community.” in EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book; LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 4. 264 This definition emphasizes two primary functions for an archival repository: first, to preserve information – i.e., to secure its long-term persistence – and second, to provide access to the archived information, in a manner consistent with the needs of the OAIS’s primary users, or Designated Community.” In LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 3. 265 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 4. 266 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 4-5. 267 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 22. 268 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 6. 66 calendário das Sessões de Submissão de Dados, o tipo de suportes ou de transmissão de dados e o modelo de dados em que se baseiam essas Sessões de Submissão de Dados, incluindo os componentes lógicos dos SIPs (Objectos de Conteúdos de Dados, Informação de Representação, PDI; Informação de “Empacotamento” e informação de Descrição).269 Tal Acordo de Submissão inclui ainda informação sobre as restrições de acessos aos dados e requisitos de aplicação das medidas270, e procedimentos e protocolos que permitem o OAIS verificar com o Produtor a chegada e completude das Sessões de Submissão de Dados, ou questioná-lo acerca dos conteúdos da mesma.271  O Administrador ou Gestor272, que fornece a política geral do arquivo OAIS e efectua o controlo de gestão. O gestor distingue-se da administração (entidade funcional de administração) por o primeiro não estar envolvido nas actividades e operações do dia-a-dia do arquivo; A Gestão fornece e/ou aprova os Estatutos e Objectivos do OAIS, que determinam a extensão dos grupos de Produtores e Consumidores que o Arquivo pretende atender. A título de exemplos de interacção entre a Gestão e o OAIS são o financiamento e fornecimento de orientações para utilização dos recursos, a avaliação do cumprimento dos objectivos a longo-prazo e dos riscos a que tanto o OAIS como a informação custodiada estão expostos, pela política de preços dos serviços fornecidos, pela resolução de conflitos entre produtores, consumidores e administração interna do OAIS, e finalmente pelo estabelecimento de procedimentos que assegurem a utilização do OAIS dentro da sua esfera de influência.273  O consumidor, que procura e adquire informação que se encontra preservada no arquivo OAIS. A informação que o OAIS pretende preservar tem que ter interesse para os potenciais consumidores, cliente, ou Comunidade Designada.274 Por norma é o arquivo OAIS que define a Comunidade Designada alvo, podendo ser objecto de acordo com os financiadores e outras partes interessadas. As interacções entre os consumidores e o OAIS são de vários tipos e incluem perguntas de serviço de apoio/”helpdesk”, solicitação de manuais, pesquisas de catálogo e informação sobre estados de encomendas/pedidos. O procedimento de encomendas/pedidos reveste-se de especial interesse para o Modelo de Referência OAIS, uma vez que lida com o fluxo que existe entre o OAIS e os consumidores, da informação custodiada.275 O consumidor estabelece um Acordo de encomendas/pedidos de informação com o OAIS, e que identifica um ou mais AIPs de interesse, como esses AIPs devem ser transformados e mapeados em DIPs e como estes DIPs serão “empacotados” na 269 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- 9. 270 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 210. 271 EUA. CCSDS - Reference Model for an Open Archival Information System (OAIS): magenta book, p. 210. 272 O termo original, Management, é traduzido por Lurdes Saramago como Gestor, enquanto outros autores lusófonos, como Miguel Ferreira, utilizam o termo Administração. 273 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 29. 274 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 23. 275 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 210. 67 Sessão de Disseminação de Dado. O Acordo de encomendas/pedidos estabelece ainda os prazos de entrega, o número de Sessões de Disseminação de Dados, informação sobre a entrega (nome, endereço), direitos de informação (restrições de utilização, consumidores autorizados, ou taxas) e os preços acordados. As encomendas/pedidos podem efectuar-se ad-hoc ou serem programadas com base num evento que o despolete. O modelo de referência define uma classe especial de consumidores referida como Comunidade Designada: O conjunto de consumidores que se presume compreender de forma independente a informação arquivada, tal como se encontra preservada e disponibilizada pelo OAIS. Estes utilizadores principais são a Comunidade Designada do OAIS.276 É o âmbito da Comunidade Designada que determina tanto o conteúdo do OAIS como a forma em que os conteúdos são preservados, de modo a que permaneçam à disposição da Comunidade Designada de maneira independentemente compreensível. Entende-se o termo independentemente compreensível como o acesso, compreensão, e interpretação da informação do OAIS sem necessidade de recorrer a estratégias, interpretes, ou mesmo aos produtores especializados. A definição do âmbito da Comunidade Designada é um aspecto crítico do processo de preservação de um arquivo OAIS, uma vez que, quanto mais amplo for o âmbito da Comunidade Designada, maiores serão os requisitos de metainformação necessários para a manutenção da informação digital a longo prazo.277 De notar que o âmbito Comunidade Designada não é necessariamente estático: nada que impede que a Comunidade Designada mude ao longo do tempo. Estas alterações podem ser em termos de Características dinâmicas da Comunidade Designada incluir o seu alcance, bem como as expectativas dos seus membros em relação ao acesso e utilização do conteúdo do OAIS. Os conceitos Gestão, Produtores, Consumidores, e Comunidade Designada, bem como um OAIS, representam papéis mais funcionais do que organizacionais, pelo que todos estes papéis podem ser partes de uma única estrutura organizacional, ou distribuídos por várias organizações. O ponto essencial não é a separação física de um papel de outro, mas sim, a separação lógica das funções de tomada de decisão e os interesses das partes interessadas ligadas à maioria das actividades de preservação digital.278 O Modelo de Informação do OAIS O Modelo de Referência OAIS apresenta um modelo de informação que se apoia na linguagem UML (Unified Modeling Language) de representação de objectos, num diagrama de classes. Uma classe descreve as responsabilidades, o comportamento e o tipo de um conjunto partilhado de propriedades do objecto. Uma classe é um conceito abstracto que representa objectos concretos. Estes objectos concretos chamam-se instância da classe. Neste âmbito, a Informação define-se como qualquer tipo de conhecimento que pode ser transmitido, que é sempre representado por um tipo de dados.279 276 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 6. LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 6. 278 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 7. 279 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 23. 277 68 O Objecto de Dados O objecto de dados de conteúdo (ou seja, uma sequência de bits) pode ser constituído por um único ficheiro digital, - por exemplo, um documento em formato PDF; também podem incluir vários ficheiros, como um sítio web que consiste em texto (ficheiros HTML) e imagens estáticas (GIF ou JPEG). O ponto fulcral é que o OAIS é responsável pela preservação a longo prazo do objecto de dados de conteúdo, assim como da sua disponibilização sob uma forma que seja independentemente compreensível para a Comunidade Designada.280 O objecto de dados pode ser expresso como um objecto físico (por exemplo, uma pedra da Lua), juntamente com alguma informação de Representação, ou pode ser expressa como um objecto digital (ou seja, uma sequência de bits), juntamente com a informação de Representação dando sentido aos bits.281 O Objecto de Informação Para preservar a informação digital, como um ficheiro, que é constituída por código binário, é indispensável saber, por exemplo, o tipo de formato, o código dos caracteres. Essa informação consta no Objecto de Informação. Para o Modelo de Referência OAIS, o Objecto de Informação é a combinação de Dados com Informação de Representação.282 O Objecto da Informação é assim composto pelo objecto de dados físicos ou digitais, e a Informação de representação, que permite a interpretação completa dos dados em informação significativos.283 A Informação de Representação Para cumprir com a segunda responsabilidade - disponibilizar o objecto de dados de conteúdo de uma forma que seja independentemente compreensível pela Comunidade Designada - o objecto de dados de conteúdo deve ser acompanhada por uma quantidade adequada de informação de Representação.284 A Informação de Representação é a informação que mapeia um objecto de dados em conceitos mais significativos285, permitindo a interpretação/compreensão dos dados para obter a informação. Assim podemos dizer que os dados interpretados utilizando a sua Informação de representação “fornecem” Informação286, como se pode ver na figura seguinte. 280 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 12. EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 421. 282 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 420. 283 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 420/21. 284 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 12. 285 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 114. 286 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 24. 281 69 Objecto de Dados Interpretável Informação de usando a sua Representação Fornece Objecto de Informação Figura 4 - Obtenção de Informação a partir dos Dados A informação de Representação que acompanha um objecto digital, ou sequência de bits, é usado para dar significado adicional. Normalmente mapeia os bits em tipos de dados comumente reconhecidos e agrupa-os com base nestes tipos de dados. Associa estes grupos a significados de alto nível: inclui a descrição das maneiras, possivelmente complexas, de como os objectos estão interrelacionados287. “Representation Information might include a description of the hardware and software environment needed to display the Content Data Object and/or access its contents; it might also summarize the appropriate interpretation of the Content Data Object. For example, if the Content Data Object is an ASCII file of numbers, Representation Information might indicate that the numbers correspond to average daily air temperature readings for Manhattan, measured in degrees Celsius, for the period 1972 – 2000.288” Para que esse Objecto de Informação seja preservado com êxito, é fundamental que o OAIS identifique e compreenda claramente o objecto de dados e a sua Informação de Representação associada. No caso da informação digital, isso significa que o OAIS deve identificar claramente os bits e a Informação de Representação relativa a esses bits. Esta transparência necessária ao nível dos bits é uma característica que distingue a preservação da informação digital, e vai contra as concepções orientadas a objectos que tentam esconder essas questões de implementação.289 O âmbito da Comunidade Designada tem impacto na quantidade de metainformação necessária para suportar o processo de preservação, no que se refere à Informação de Representação. Normalmente quanto mais abrangente for o âmbito da Comunidade Designada, menos especializada será a base de conhecimento ligada a essa comunidade, o que se traduz na assunção por parte do OAIS de que a Comunidade Designada possui menos informação relevante para interpretar e compreender a informação arquivada. Se a base de conhecimento for menos especializada será necessária mais informação de representação para garantir que a informação preservada contínua processável e compreensível a longo prazo para a Comunidade Designada.290 A Informação de Representação é um Objecto de Informação que pode ter seu próprio objecto de dados e sua própria Informação de Representação associada à compreensão de cada 287 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 421. 288 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 12. 289 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 24. 290 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 13. 70 objecto de dado.291 O conjunto de objectos resultante pode ser referido como uma rede de representação.292 Ou seja, a Natureza recursiva da informação de representação, composta pelos seus dados e pela sua informação de representação, resulta numa rede de objectos de informação de representação.293 Como se referiu anteriormente, o objecto digital é em si composto por uma ou mais sequências de bits. O objectivo do Objecto de Informação de Representação é converter as sequências de bits em informação mais significativa. Isto é feito através da descrição do formato, ou conceitos de estrutura de dados, os quais serão aplicadas às sequências de bit e que por sua vez resultam em valores mais significativos, tais como caracteres, números, pixéis, matrizes, tabelas, etc.294 A Informação Estrutural refere-se a esses tipos comuns de dados informáticos, agregações destes tipos de dados e regras de mapeamento que mapeiam desde dos tipos de dados subjacentes até aos conceitos de mais alto nível necessários para entender o Objecto Digital. Estas estruturas são normalmente identificadas pelo nome ou pela posição relativa dentro das sequências de bit associados. A Informação Estrutural é muitas vezes referida como o "formato" do objecto digital.295 A Informação Semântica diz respeito à informação adicional acerca da linguagem utilizada quando o objecto digital é interpretado como uma sequência de caracteres de texto, e descrito como tal na Informação Estrutural, que deve ser fornecida.296 Irá incluir significados especiais associados com todos os elementos da informação estrutural, as operações que podem ser executadas em cada tipo de dados, e suas inter-relações.297 A Informação semântica associada com partes de alguma informação codificada digitalmente é independente do formato.298 A Informação de Representação pode conter Outra Informação de Representação. Isso quer dizer que a taxonomia de Informação de Representação aqui apresentada está longe de estar completa.299 A Informação relativa às relações entre a Informação Semântica e a Informação 291 EUA. CCSDS 23. 292 EUA. CCSDS 23. 293 EUA. CCSDS 4. 294 EUA. CCSDS 22. 295 EUA. CCSDS 22. 296 EUA. CCSDS 22. 297 EUA. CCSDS 22. 298 EUA. CCSDS 22. 299 EUA. CCSDS 22. - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 71 estrutural, ou acerca do software necessário para processar um ficheiro de base de dados deve considera-se como Outra Informação de Representação.300 A Informação Estrutural, a informação semântica e a Outras Informações de Representação são subtipos e componentes da Informação de Representação.301 Taxonomia dos Objectos de Informação Existem muitos tipos de informação envolvidos na preservação a longo prazo de informação dum OAIS. Cada um destes tipos pode ser encarado como um Objecto de Informação completo, na medida em que contém um objecto de dados e Informação de representação adequada para compreender os dados.302 Os objectos são classificados pelo seu conteúdo e função no funcionamento de um OAIS, incluindo objectos de Informação de Conteúdo, objectos de Informação de Descrição de Preservação, objectos de Informação de “Empacotamento”, e objectos de Informação de Descrição.303 Informação de Conteúdo A Informação de Conteúdo é o conjunto de informação que é o objecto alvo de preservação pelo OAIS304. Decidir o que é a Informação de Conteúdo pode não ser óbvio e poderá ter de ser negociado com o produtor305. A Informação de Conteúdo consiste no objecto de dados de conteúdo e a Informação de representação associada necessária para tornar o objecto de dados de conteúdo compreensível para a Comunidade Designada.306 O OAIS necessita de ter bastante Informação de Representação associada aos bits do objecto de dados de conteúdo na Informação de Conteúdo para que ele considere que os membros da Comunidade Designada possam entrar na Rede de Representação com conhecimentos suficientes para começar a interpretar a Informação de Representação de forma precisa. Uma função importante do OAIS é decidir que partes da Informação de Conteúdo são o objecto de dados de conteúdo e que partes são da Informação de Representação. Este aspecto é fundamental para uma compreensão clara do que está a ser preservado.307 Informação de Descrição de Preservação O OAIS deve garantir a existência de informação para apoiar a confiança, o acesso e o contexto da Informação de Conteúdo durante um período de tempo indefinido. O conjunto específico 300 EUA. CCSDS 22. 301 EUA. CCSDS 23. 302 EUA. CCSDS 25. 303 EUA. CCSDS 25. 304 EUA. CCSDS 6 e p. 4-26. 305 EUA. CCSDS 26. 306 EUA. CCSDS 6. 307 EUA. CCSDS 28. 72 - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- de Objectos de informação que são necessários para esta função, é chamado colectivamente de Informação de Descrição de Preservação (PDI).308 A Informação de Descrição de Preservação deve incluir a informação que é necessária para preservar adequadamente a Informação de Conteúdo específica ao qual ele está associado309, para garantir claramente a sua identificação e compreender o ambiente em que ela foi criada.310 Ele está especificamente voltado para descrever os estados passados e presentes da Informação de Conteúdo, garantindo que é inequivocamente identificável, e garantir que não tenha sido alterado inadvertidamente.311 Por esse motivo, só se pode avaliar a Informação de Descrição de Preservação após se ter definido claramente a Informação de Conteúdo.312 A Informação de Descrição de Preservação divide-se em cinco tipos de informação de preservação: 1. Proveniência: refere-se à origem ou a fonte da Informação de Conteúdo, quem teve a sua custódia desde a sua origem, e a sua história (incluindo a história da sua tramitação)313, quaisquer alterações que possam ter ocorrido desde a sua origem, proporcionando um registo de auditoria para a Informação de Conteúdo. Isso dá aos futuros utilizadores alguma garantia quanto à provável fiabilidade da Informação de Conteúdo, uma vez que contribui como evidência que suporte a Autenticidade. A Proveniência pode ser encarada como um tipo especial de informação de contexto.314 2. Contexto: descreve as relações da Informação de Conteúdo com o seu ambiente/outras informações fora do Pacote de Informação.315 Isto inclui a razão por que a Informação de Conteúdo foi criada e como se relaciona com outros objectos de Informação de Conteúdo existentes noutros lugares.316 3. Referenciação: identifica e, se necessário descreve, um ou mais mecanismos usados para fornecer um ou mais identificadores ou sistemas de identificadores, que podem ser utilizados como identificadores únicos da Informação de Conteúdo.317 Também fornece esses identificadores que permitem que sistemas externos referenciem, de forma inequívoca, essa Informação de Conteúdo em particular. Exemplos desses sistemas incluem 308 EUA. CCSDS 29. 309 EUA. CCSDS 29. 310 EUA. CCSDS 6. 311 EUA. CCSDS 29. 312 EUA. CCSDS 6. 313 EUA. CCSDS 6. 314 EUA. CCSDS 30. 315 EUA. CCSDS 6. 316 EUA. CCSDS 30. 317 EUA. CCSDS 6. - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- 73 sistemas de taxonomia, sistemas de referenciação e sistemas de registo. No modelo de referência OAIS a maioria (se não a totalidade) dessas informações são replicadas em Descrições de Pacotes, que permitem que aos consumidores aceder à Informação de Conteúdo de interesse.318 4. Fixidez (integridade): proporciona um envelope ou escudo protector contra qualquer alteração do Conteúdo de Informação que não esteja documentada.319 Fornece as verificações de integridade de dados ou chaves de validação / verificação utilizados para assegurar que o Objecto de Informação de Conteúdo específico não foi alterado de forma não documentada. Inclui esquemas especiais de codificação e detecção de erros que são específicas das instâncias dos Objectos de conteúdo. Não inclui mecanismos de preservação da integridade fornecidos pelos serviços subjacentes ao OAIS, protecção contra erros fornecidos pelos suportes e dispositivos usados pelo armazenamento de arquivo. Pode indicar a qualidade mínima do serviço para esses mecanismos.320 Trata-se de Informação de inalterabilidade e não de integridade dos suportes e sistemas de armazenamento 5. Privilégios de Acesso: reflectem os direitos de acesso, incluindo a preservação, distribuição e utilização da Informação de Conteúdo.321 Identifica as restrições de acesso relativos à Informação de Conteúdo, incluindo o enquadramento legal, termos de licenciamento e controlo de acesso. Contém as condições de acesso e de distribuição estabelecidas no âmbito do Acordo de Submissão, relacionadas tanto com a preservação (pelo OAIS) como com a utilização final (pelo consumidor). Também inclui as especificações para a aplicação das medidas relativas a direitos.322 A Informação de Direitos de Acesso surge somente na edição do Modelo de Referência OAIS de 2012. O OAIS precisa de decidir de forma explícita qual a definição exacta de Informação de Conteúdo, de modo a ser capaz de garantir que ele também possui a PDI necessária para preservar a Informação de Conteúdo. Após a definição da Informação de Conteúdo é possível avaliar a Informação de Descrição de Preservação.323 Informação de “Empacotamento” A Informação de “Empacotamento” refere-se à informação que junta, identifica e relaciona, de forma real ou lógica, a Informação de Descrição de Preservação e Informação de Conteúdo.324 Refere ou liga os componentes do pacote numa entidade identificável num dado suporte.325 318 EUA. CCSDS 30. 319 EUA. CCSDS 7. 320 EUA. CCSDS 30. 321 EUA. CCSDS 7. 322 EUA. CCSDS 30. 323 EUA. CCSDS 32. 324 EUA. CCSDS 7. 74 - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- A Informação de “Empacotamento” não precisa necessariamente ser preservada pelo OAIS uma vez que não contribui para o conteúdo da informação ou o PDI. No entanto, existem casos em que o OAIS necessita de reproduzir a submissão original de maneira exacta. Neste caso, a Informação de Conteúdo é definida para incluir todos os bits submetidos.326 O OAIS também deve evitar guardar PDI ou Informação de Conteúdo somente nas convenções de nomenclatura de estruturas de directórios ou nome de ficheiros. Estas estruturas são mais susceptíveis de ser utilizados como Informação de “Empacotamento”. A Informação de “Empacotamento” não é preservada por todas as Migrações Digitais. Todas as informações gravadas em nomes de ficheiros ou estruturas de directórios podem ser perdidas quando a Informação de “Empacotamento” é alterada. O assunto da Informação de “Empacotamento” é uma questão importante para a migração de Informação dentro de um OAIS para suportes mais recentes.327 Informação de Descrição O OAIS tem que fornecer ferramentas para permitir aos consumidores localizar informação de interesse potencial, analisar essa informação e solicitar a informação desejada. Isto é realizado através de um Objecto de Informação especial chamado Informação de Descrição, que contém os dados que servem como entradas para documentos ou aplicativos chamados Instrumentos Auxiliares de Acesso. 328. A Informação de Descrição é utilizada para o consumidor descobrir qual o pacote que contem a Informação de Conteúdo pretendida, podendo ir desde um simples título descritivo do Pacote de Informação que surge numa mensagem, até a um conjunto completo de atributos de metainformação pesquisáveis numa base de dados de pesquisa.329 A Informação de Descrição deriva geralmente da Informação de Conteúdo e da PDI. A Informação de Descrição pode ser vista como um índice para permitir um acesso eficiente ao Pacote de informação associado através dos Instrumentos Auxiliares de Acesso associados. Os Instrumentos Auxiliares de Acesso são documentos ou aplicativos que podem ser usados para localizar, analisar, recuperar ou solicitar informação ao OAIS.330. O Modelo de Referência também fornece uma descrição de alto nível dos objectos digitais geridos pelo arquivo.331 325 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 432. 326 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 432. 327 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 432. 328 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 433. 329 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 27. 330 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 433. 331 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 10. 75 Pacotes de Informação Toda a submissão de informação que um produtor efectua no OAIS e toda a disseminação de informação para um Consumidor ocorre como uma ou mais transmissões discretas.332 Estas transmissões ocorrem utilizando um Pacote de Informação333, a estrutura conceptual de apoio à preservação da informação a longo prazo334, ou seja, e como se pode ver na figura seguinte, um contentor conceptual que contém dois tipos de objectos de informação: a Informação de Conteúdo e a Informação de Descrição de Preservação.335 O Pacote de Informação pode ser associado a dois outros tipos de objectos de informação336: a Informação de “Empacotamento”, que encapsula337 e delimita338 o pacote, e a Descrição do Pacote, que o identifica339 para permitir o acesso eficiente.340 Existem vários tipos de pacotes de informação, que são utilizados no âmbito do processo de arquivamento. Estes pacotes de informação podem ser usados para estruturar e armazenar a informação custodiada no OAIS, para transportar a informação necessária do produtor ao OAIS, ou para o transporte de informação solicitada entre o OAIS e os consumidores Existem diferentes requisitos de informação para cada uma dessas funções.341 Informação de Informação de Descrição de Conteúdo Informação Informação de “Empacotamento” Informação de Pacote 1 Descrição sobre o pacote 1 Figura 5 - O Pacote de Informação Em resumo: 332 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- 5. 333 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- 5. 334 EUA. CCSDS 33. 335 EUA. CCSDS 5 e 4-33. 336 EUA. CCSDS 33. 337 EUA. CCSDS 5. 338 EUA. CCSDS 33. 339 EUA. CCSDS 5. 340 EUA. CCSDS 33. 341 EUA. CCSDS 33. 76 - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 2- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- “The information components described above – Content Information (the Content Data Object and Representation Information), Preservation Description Information (Reference, Context, Provenance, and Fixity Information), Packaging Information, and Descriptive Information collectively form the Archival Information Package, which in turn represents the combination of the preserved digital information and a complete set of associated metadata.”342 É necessário distinguir entre um pacote de informação que é preservado por um OAIS e os pacotes de informação que são submetidos a, ou disseminados a partir de, um OAIS. Estes pacotes variantes são necessários para reflectir o facto de que alguns pedidos a um OAIS terão informação de Representação ou PDI insuficiente para atender aos requisitos de preservação do OAIS. Além disso, eles podem ser organizados de forma muito diferente do modo como o OAIS organiza a informação que está a preservar. Finalmente, o OAIS pode fornecer informação aos Consumidores que não inclui toda a informação de Representação ou todo o PDI com a Informação de Conteúdo associada a ser disseminada.343 Dentro dos Pacotes de Informação podemos distinguir três tipos ou variantes, tendo em conta a sua função, a saber: o Pacote de Submissão de Informação (SIP), o Pacote de Informação de Arquivo (AIP), e o Pacote de Disseminação de Informação (DIP ). Embora sejam todos pacotes de informação, eles diferem em conteúdo obrigatório e na multiplicidade das associações entre classes contidas.344 As definições destes tipos de pacotes baseiam-se em função do processo de arquivamento, que usa o pacote, e a conversão de um pacote para outro à medida que vai avançando no processo de arquivamento.345  O SIP é o pacote enviado por um produtor para um OAIS. A sua forma e conteúdo detalhado é normalmente negociado entre o produtor e o OAIS.346 “The concept of the SIP emphasizes the fact that information may not be preserved in the exact form in which it is submitted by the Producer.”347 A maioria dos SIPs inclui Informação de Conteúdo e alguma PDI que, tal como a sua Informação de Representação, pode considerar-se incompleta para cumprir com os requisitos de preservação da Informação.348 Podem ser necessários vários SIPs para fornecer um conjunto completo de Informação de Conteúdo e PDI associado.349 342 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 14. EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 435. 344 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 435. 345 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 434. 346 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 435. 347 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 11. 348 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 27. 349 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 435. 343 77 “the Producer may provide the information in a format not supported by the OAIS, necessitating migration to another format prior to inclusion in the archival store.”350 A informação de descrição associada a um SIP será provavelmente fornecida antes da submissão do SIP ao OAIS, mas pode ser fornecida a qualquer momento.351  O AIP, com funções de preservação, é fruto da transformação de um ou mais SIPs. É composto por um conjunto completo de PDI da Informação de Conteúdo a que se refere, podendo também conter uma colecção de outros AIPs. A sua Informação de “Empacotamento” tem que estar em conformidade com as normas internas OAIS e pode variar uma vez que é gerido pelo OAIS.352 A informação de descrição associada a um AIP pode ser extensa e será gerida pelo OAIS para que os consumidores possam encontrar e solicitar a Informação de Conteúdo do seu interesse.353  O DIP é fornecido em resposta de um pedido de um Consumidor, e contendo parte ou todo o conteúdo de um AIP ou colecção de AIPs.354 A Informação fornecida pode ou não incluir a totalidade da Informação de Representação ou da PDI355, mas a forma de apresentação tem que ter em conta os requisitos do suporte e do Consumidor. Adicionalmente, a Informação de “Empacotamento” tem que estar presente numa forma em que o Consumidor possa distinguir claramente a informação que solicitou.356 A Informação de “Empacotamento” pode assumir várias formas, dependendo do suporte usado para disseminação e as exigências dos consumidores. A informação de descrição associada com um DIP pode ser fornecida em qualquer momento antes, durante ou depois da transferência do DIP. O seu objectivo é dar ao consumidor informação suficiente para reconhecer o DIP entre possíveis pacotes semelhantes. Pode haver mais do que uma descrição de texto com um nome ou título, como transportado pela Informação de “Empacotamento”, através do qual o DIP pode ser reconhecido.357 O conteúdo de informação exacto do SIP e do DIP e a sua relação com o AIP correspondente dependem dos acordos celebrados entre o Arquivo e seus produtores e consumidores.358 350 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 11. EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 435. 352 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 28. 353 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 436. 354 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 28. 355 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 27. 356 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 28. 357 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 436. 358 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 436. 351 78 Embora a implementação do AIP possa variar de arquivo para arquivo, a especificação do AIP como um contentor que contém toda a informação necessária para permitir a preservação de longo prazo e o acesso à informação custodiada pelo Arquivo permanece válida.359 A figura 6 360 mostra as ligações dos vários elementos abordados no âmbito do Modelo de Informação apresentado no Modelo de Referência OAIS. Base de Conhecimento Informação de Descrição Objecto Digital Pacote de Submissão de Informação Informação de Conteúdo Objecto de Dados Objecto de Informação Pacote de Informação Informação de Descrição de Preservação Objecto Físico Informação de Representação Pacote de Informação de Arquivo Pacote de Disseminação de Informação Informação de Empacotamento Figura 6 - O Modelo de Informação OAIS O Modelo Funcional do OAIS Para além do modelo de informação, o Modelo de referência OAIS, inclui o modelo funcional, que identifica e descreve o conjunto central de mecanismos com que um arquivo OAIS cumpre a sua missão de preservar e disponibilizá-la à Comunidade Designada. Estes mecanismos são resumidos no modelo funcional OAIS e incluem um conjunto de seis serviços ou componentes funcionais de alto nível, que em conjunto, cumprem com o papel duplo de preservar e fornecer acesso à informação custodiada.361 359 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 436. 360 Figura adaptada de THOMAZ, Katia; SOARES, Antonio José - A preservação digital e o modelo de referência Open Archival Information System (OAIS). 361 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 7. 79 O OAIS pode ser dividido em seis entidades funcionais e interfaces relacionadas. Como se pode ver na seguinte figura, as linhas de conexão das entidades identificam fluxos de informação.362 Figura 7 - O Modelo Funcional OAIS O Papel de cada uma das entidades é o seguinte:  Entidade Funcional de Ingestão aceita os Pacotes de Submissão de Informação (SIPs) de Produtores (ou de elementos internos sob o controlo da Entidade Funcional de Administração) e prepara os conteúdos para armazenamento e gestão dentro do Arquivo. As funções de Ingestão incluem a recepção dos SIPs363, efectuar o controlo de qualidade dos SIPs364, gerar um pacote de informação de arquivo (AIP), gerar Informação Descritiva365 pela extracção de informação descritiva dos AIPs, coordenação das actualizações para as entidades funcionais de Armazenamento de arquivo e de Gestão de Dados.366 362 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 1. 363 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 1. 364 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 1. 365 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 7. 366 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 1. 80 ”In short, the Ingest function serves as the OAIS’s external interface with Producers, managing the entire process of accepting custody of submitted information and preparing it for archival retention.”367  Entidade Funcional de Armazenamento de Arquivo368 fornece os serviços e funções de armazenamento, manutenção e recuperação do AIP. As funções de armazenamento de arquivo incluem a recepção do AIP da entidade funcional de Ingestão e adicionamento do mesmo no armazenamento permanente369, gestão da hierarquia de armazenamento370 para responder às exigências de qualidade de serviço das entidades utilizadoras, refrescamento dos suportes nos quais estão armazenados as informações custodiados pelo Arquivo OAIS371, realização de verificações de rotina e de erro372, fornecimento de recursos para recuperação de desastres373, envio do AIP para a entidade funcional de Acesso para resolução de encomendas. ”Note that the Archival Storage function has no direct external interface; interaction with Archival Storage is confined to the OAIS’s internal high-level services.”374  Entidade Funcional de Gestão de Dados fornece os serviços e funções de preenchimento, manutenção e acesso à Informação Descritiva que identifica e documenta a informação custodiada pelo Arquivo e dados administrativos utilizados para gerir o Arquivo OAIS. As funções de gestão de dados incluem a administração da base de dados do arquivo OAIS (mantendo as definições de esquema e de visualização, e integridade referencial)375, realização das actualizações à base de dados (carregamento de nova Informação Descritiva ou dados administrativos do Arquivo)376, realização de consultas sobre os dados de gestão de dados para gerar respostas a consultas377, e elaboração de relatórios a partir das respostas a consultas.378 367 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 8. O termo original, Archival Storage, é traduzido por Lurdes Saramago como Repositório, enquanto outros autores lusófonos, como Miguel Ferreira, utilizam o termo Repositório de Dados. 369 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 370 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 371 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 372 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 373 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 374 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 9. 375 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 376 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 377 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 378 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 368 81  Entidade Funcional de Acesso fornece os serviços e funções de apoio aos consumidores na verificação da existência, descrição, localização e disponibilidade das informações armazenadas no OAIS e permite aos consumidores a solicitação e recepção de produtos de informação.379 “it is the primary mechanism by which the OAIS meets its responsibility to make its archived information available to the user community.”380 As funções de acesso incluem a comunicação com os consumidores para receber pedidos381, a aplicação de controlos para restringir o acesso à informação de protecção especial382, a coordenação da execução de pedidos para conclusão com êxito383, gerar respostas (Pacotes de disseminação de informação, respostas a consultas, relatórios)384 e entregar as respostas aos Consumidores.385  Entidade Funcional de Administração fornece os serviços e funções referentes ao funcionamento global do sistema de arquivo, “as well as coordinating the activities of the other five high-level OAIS services.”386 As funções de administração incluem a solicitação e negociação de acordos de submissão com os produtores387, auditoria de submissões para assegurar que cumprem as normas do Arquivo388, controlo e fornecimento de mecanismos para restringir ou permitir o acesso físico (portas, fechaduras, guardas) a elementos do arquivo, conforme determinado pelas políticas de Arquivo.389 As funções de engenharia de sistemas incluem a manutenção da gestão de configuração do hardware e software do sistema390, monitorizar e aperfeiçoar as operações do Arquivo391, inventariar, reportar e migrar / actualizar os conteúdos do 379 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 2. 380 381 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 9-10. EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 3. 382 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 3. 383 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 3. 384 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 3. 385 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42 e 4-3. 386 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 10. 387 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 388 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 389 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 412. 390 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 391 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 82 Arquivo.392 Outras funções incluem o estabelecimento e manutenção de normas e políticas de arquivo393, fornecimento de suporte ao cliente394, activar pedidos/solicitações armazenadas.395 “Administration serves as the central hub for the OAIS’s internal and external interactions: it communicates directly with the five other OAIS high-level services – Ingest, Archival Storage, Data Management, and Access, as well as the OAIS’s external stakeholders – Producers, Consumers and Management.”396  Entidade Funcional de Planeamento de Preservação fornece os serviços e funções de monitorização do ambiente envolvente do OAIS e fornecimento de recomendações e planos de preservação para assegurar que a informação armazenada no OAIS permanece acessível e compreensível pela Comunidade Designada a longo prazo, mesmo que o ambiente informático inicial se tiver tornado obsoleto, ou mesmo se ocorrerem: “shifts in the scope or expectations of the Designated Community.”397 As funções de planeamento de preservação incluem avaliar o conteúdo do Arquivo e recomendar actualizações periódicas de informações de arquivo398, recomendar a migração de informação depositada no Arquivo399, desenvolver recomendações para normas e políticas do Arquivo400, fornecer relatórios periódicos de análise de risco401, monitorizar alterações ao ambiente tecnológico402, monitorizar alterações nas necessidades de serviços e conhecimento de base da Comunidade Designada403, desenhar modelos de pacote de informação404, desenvolver planos de migração detalhados, protótipos de software e planos de teste para permitir a implementação de metas de migração da Administração405, 392 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 2. 393 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 2. 394 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 2. 395 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 2. 396 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 10. LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p.9. 398 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 399 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 400 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 401 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 402 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 403 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 404 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 405 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 42. 397 83 proporcionar assistência no planeamento e revisão para especializar esses modelos em SIPs e AIPS para submissões específicas.406  Os Serviços Comuns são considerados como constituindo uma outra entidade funcional neste modelo. Esta entidade é tão profunda que, para maior clareza, não é mostrada na figura.407 Estes serviços incluem serviços do sistema operativo que fornecem os serviços básicos necessários para operar e administrar a plataforma aplicacional e fornecer uma interface entre o software aplicativo e a plataforma408, serviços de rede que fornecem os recursos e mecanismos para suportar aplicações distribuídas que necessitam de acesso a dados e a interoperabilidade das aplicações em ambientes heterogéneos ligados em rede409, serviços de segurança que fornecem recursos e mecanismos para proteger a informação sensível e tratamento no sistema de informação. O nível apropriado de protecção é determinado com base no valor da informação para os utilizadores finais da aplicação e a percepção de ameaças a ele.410 “In summary, the OAIS encompasses six high-level functional components which, taken together, constitute the mechanisms by which the OAIS preserves information over the long-term and makes it available to the Designated Community. An OAIS-type archive will implement each of these services, in one form or another, in the course of building a complete archival system.”411 Este modelo parece ser reminiscente do modelo de comunicação desenvolvido por Shannon (1948) e a que se junta Weaver (1949) e que levou ao desenvolvimento da Teoria da Informação. Assim:  A fonte de informação teria como equivalente o Produtor, por produzir a mensagem;  A mensagem referir-se-ia aos pacotes de informação SIPs, AIPs e DIPs, como dados ou informação de que é enviada para o destinatário de forma verbal, escrita, registada, ou visual;  O canal, que inclui as entidades funcionais de gestão de dados, de armazenamento de arquivo ou repositório de dados, e de planeamento de preservação, e que garantem que os dados ou a informação são adaptados para a sua transmissão.  O transmissor equivaleria à entidade funcional de Ingestão, que codificaria a mensagem; 406 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 2. 407 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 4- 3. 408 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 43 e 4-4. 409 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 44. 410 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 44 e 4-5. 411 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 10. 84  O receptor ou descodificador, à entidade funcional de Disseminação, que descodifica ou reconstrói a mensagem para ficar compreensível ao destinatário.  O destinatário, que corresponde ao consumidor.  O ruído, aqui considerado como elemento de degradação da informação e da própria transmissão dos dados, é antecipado, evitado, mitigado e tratado pela intervenção das entidades funcionais de planeamento de preservação e de Administração. Outras semelhanças entre o modelo de Shannon e o modelo OAIS prendem-se com o facto de ambos não especificarem as questões ligadas com o contexto (de produção, transmissão, recepção) nem diferenciarem suportes de transmissão.412 Por outro lado a entidade funcional de Disseminação também adquire propriedades de transmissor aquando do feedback dos consumidores, embora o feedback não tenha sido abordado no modelo de Shannon, por não ser bidireccional. Para além disso, o modelo de Shannon não leva em consideração o dinamismo da dimensão Tempo, algo que tem suma importância no Modelo OAIS, evidenciada na existência da entidade funcional de planeamento de preservação, por influir no risco de obsolescência da informação armazenada. OAIS e a Normalização O modelo identificou um conjunto de áreas para desenvolvimento de normas relacionadas com o modelo OAIS, que dizem respeito, em particular, às relações arquivo-produtor, bem como a certificação de arquivos. Também serviu de referência para o desenvolvimento de muitas aplicações de software. As áreas de normalização incluem interfaces entre Arquivos OAIS, metodologia de submissão (ingestão) utilizada pelo Arquivo, submissão (ingestão) de fontes de informação digital para o Arquivo, fornecimento (disseminação) de fontes digitais pelo Arquivo, submissão de metainformação digital ou fontes de dados físicos para o Arquivo, normas de sintaxe para a identificação de fontes digitais dentro do Arquivo, protocolos de pesquisa e localização de metainformação sobre fontes de dados físicos e digitais, acesso a suportes que permita a substituição de sistemas de gestão de suporte sem necessidade de regravar o suporte, suporte físicos em específico, migração de informação para vários formatos e suportes, práticas de gestão documental, práticas de certificação de Arquivos. Para além da norma OAI-PMH, que abordamos anteriormente, apresentam-se de seguida outras iniciativas. Metainformação de preservação Embora o modelo não define esquemas de metainformação, apresenta um modelo de informação que serve de base à definição de várias normas relativas a metainformação. Exemplos disso são o projecto CURL Exemplars in Digital Archives (CEDARS)413, o projecto 412 No caso do OAIS, este tanto pode ser aplicado em repositórios em suporte digital como em suporte analógico, como se pode constatar nos exemplos em EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): blue book, p. A1-A27. 413 DAY, Michael - CEDARS guide to preservation metadata. 85 Networked European Deposit Library (NEDLIB)414, National Library of Australia (NLA)415 e especialmente o PREMIS (PREservation Metadata: Implemetation Strategies). Este grupo está na origem de um esquema de metainformação bastante detalhado e abrangente. O OCLC e o RLG patrocinaram actividades de desenvolvimento de consensos em duas áreas relacionadas com o modelo de referência OAIS. A primeira área abordou os requisitos de metainformação associados à preservação de informação digital a longo prazo.416 Isto resultou na publicação, em 2001, de um Livro Branco intitulado Preservation Metadata for Digital Objects: A Review of the State of the Art417, resultante do trabalho do grupo de trabalho internacional de especialistas que analisava a preservação digital na perspectiva do património cultural. Nessa publicação é introduzido o conceito de metainformação de preservação, definindo a sua importância no âmbito da preservação digital a longo prazo, e apresenta ainda uma análise e sistematização de uma série de esquemas de metainformação de preservação já existentes, nomeadamente do NLA e dos projectos CEDARS e NEDLIB, com o objectivo de identificar pontos convergentes e divergentes. Um dos aspectos que consideramos de maior importância é a utilização dos conceitos do modelo de referência OAIS como ponto de partida para o esquema. O Livro Branco forneceu o contexto para o desenvolvimento do relatório A Metadata Framework to Support the Preservation of Digital Objects418, em 2002, em que o mesmo grupo de trabalho apresentava um quadro abrangente de metainformação de preservação, que identificava e descrevia os tipos de informação que podiam ser utilizados para apoiar a preservação da informação digital. Este quadro apresentava-se como uma estrutura conceptual expandida para o modelo OAIS, juntamente com um conjunto de elementos “protótipo" de metainformação, mapeados para a estrutura conceptual e reflectindo os conceitos e requisitos de informação estabelecidos no modelo de referência OAIS. O quadro aprofundou a definição dos componentes de informação constitutivos de um AIP, e clarificou como é que a metainformação de preservação oferece suporte ao processo preservação.419 Na continuidade deste trabalho, a OCLC e a RLG estabeleceram um segundo grupo de trabalho, Preservation Metadata: Implementation Strategies, ou PREMIS, composto por representantes de bibliotecas, museus, organismos governamentais e do sector privado de vários países com experiência no desenvolvimento de repositórios para preservação digital a longo prazo.420 Usando como ponto de partida do quadro de metainformação de preservação apresentada pelo outro grupo de trabalho, desenvolveu recomendações para um conjunto implementável de elementos "centrais" de metainformação de preservação, apoiados por um dicionário de dados, e amplamente aplicáveis dentro da comunidade da preservação digital e 414 LUPOVICI, Catherine; MASANÈS, Julien - Metadata for the long term preservation of electronic publications. 415 AUSTRÁLIA. National Library of Australia - Preservation metadata for digital collections. 416 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 14. 417 DALE, Robin - Preservation metadata for digital objects : a review of the state of the art : a white paper. 418 LAVOIE, Brain [et al.] - Preservation metadata and the OAIS information model: a metadata framework to support the preservation of digital objects. 419 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 15. 420 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 15. 86 suportados por recomendações e orientações para codificação, armazenamento e gestão de metainformação dentro de um sistema de arquivo digital OAIS. O PREMIS lançou em 2005 o relatório Data Dictionary for Preservation Metadata: Final Report of the PREMIS Working Group421 que inclui o Dicionário de Dados PREMIS 1.0, um recurso abrangente e prático para a implementação de metainformação de preservação em sistemas de arquivo digital, o relatório de acompanhamento, que fornece contexto, modelo de dados, pressupostos, tópicos especiais, glossário, exemplos de utilização, e o esquema XML desenvolvido para apoiar o uso do Dicionário de Dados. Após a publicação do Dicionário de Dados o grupo de trabalho foi substituído pelo PREMIS Maintenance Activity, apoiado pela Biblioteca do Congresso dos Estado Unidos, e que foi incumbido de manter o Dicionário de Dados e coordenar esforços para aprofundar a compreensão de metainformação de preservação e tópicos relacionados. Este trabalho resultou na publicação da versão 2.0 do PREMIS em Março de 2008.422 Seguiramse alterações incrementais ao Dicionário de Dados e esquema XML na versão 2.1423 em 2011 e na versão 2.2424 no ano seguinte. Mais recentemente, na PREMIS Implementation Fair no iPres2013 in Lisboa, começaram a ser discutidas as alterações a serem incluídas no PREMIS 3.425 Confiança e Certificação A segunda iniciativa patrocinada pela OCLC / RLG que criou um grupo de trabalho composto por especialistas internacionais para abordar as características de um repositório digital confiável, com o objectivo de enumerar as características que, em conjunto, servissem para inspirar, na Comunidade Designada, a confiança de que o repositório é de facto capaz de preservar e disponibilizar a parte da informação académica e cultural sob sua custódia.426 Partindo dos conceitos e modelos apresentados na norma OAIS, publicaram em 2002 o relatório Trusted Digital Repositories: Attributes and Responsibilities.427 Este documento apresenta um quadro de atributos e responsabilidades para repositório digital confiável, fiáveis e sustentáveis, capazes de lidar com a variedade de materiais mantidos por grandes e pequenas instituições de património cultural e de investigação. O quadro era suficiente amplo para acomodar uma heterogeneidade de situações, arquitecturas tecnológicas e responsabilidades institucionais, facultando uma base para as expectativas de um repositório confiável. Este documento foca atributos organizacionais e técnicos de alto nível e apresenta modelos potenciais para a certificação repositório digital. Outro aspecto deste documento é o facto de não tecer considerações sobre a natureza específica dos repositórios e arquivos digitais rapidamente emergentes, tendo em vez disso, reiterado o apelo à certificação de repositórios digitais, recomendando o desenvolvimento de programas de certificação e articulação de critérios auditáveis. Baseando-se nos conceitos do modelo de referência OAIS, e em particular, na definição de um repositório digital confiável identificada no relatório do RLG/OCLC, foi estabelecido um grupo 421 CAPLAN, Priscilla [et al.] - - Data dictionary for preservation metadata: final report of the PREMIS working group. 422 GUENTHER, Rebecca [et al.] - PREMIS data dictionary for preservation metadata, v 2.0. 423 GUENTHER, Rebecca [et al.] - PREMIS data dictionary for preservation metadata, v 2.1. 424 GUENTHER, Rebecca [et al.] - PREMIS data dictionary for preservation metadata, v 2.2. 425 PREMIS – 2013 PREMIS Implementation Fair (PIF) minutes. 426 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 15. 427 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities. 87 de trabalho constituído por indivíduos de uma variedade de origens institucionais e geográficas, a Task Force on Digital Repository Certification, sob o patrocínio do National Archives and Records Administration (NARA) e a RLG. O grupo de trabalho identificou "elementos certificáveis" de um repositório digital, e desenvolveu um plano para o estabelecimento de organismos, políticas e procedimentos competentes para certificação de repositórios digitais.428 Em 2005 o grupo de trabalho publicou um projecto de lista de verificação para certificar repositórios digitais com o nome de An Audit Checklist for the Certification of Trusted Digital Repositories429 e convidou a comunidade de interesse a comentar sobre este projecto de documento. A versão final resultou em 2007 no Trustworthy Repositories Audit & Certification: Criteria and Checklist (TRAC)430, que reflecte esse feedback e os resultados de projectos do CRL, com a intenção de apresentar o seu trabalho para o processo de normalização no seio da Organização Internacional de Normalização (ISO). Esta intenção foi levada a cabo pela CCSDS, que partindo do TRAC, publica em 2011 as recomendações Audit and Certification of Trustworthy Digital Repositories431 e Requirements for Bodies Providing Audit and Certification of Candidate Trustworthy Digital Repositories432, actualmente, cuja segunda versão data de Março de 2014.433 A primeira recomendação é aprovada como norma ISO 16363:2012434 em 2012 e a segunda encontra-se actualmente em fase de análise como ISO/PRF 16919.435 Digno de nota é ainda o desenvolvimento na Alemanha, onde o Ministério da Educação e Investigação reuniu representantes de bibliotecas, arquivos, museus, instituições de investigação, organismos editoriais e especialistas em software e da área da certificação num grupo de trabalho para a certificação de repositórios digitais e que deu origem ao projecto Network of Expertise in long-term STORage and Accessibility of Digital Resources in Germany (NESTOR)436, com o fito de criar um catálogo de critérios de fidedignidade e preparar a certificação de repositórios digitais de acordo com procedimentos nacionais e internacionais, nomeadamente no modelo de referência OAIS. Partindo de documentos como o DINI Certificate for document and publication services437 do DINI (Iniciativa Alemã para a Informação de Rede), o relatório "Trusted Digital Repositories: Attributes and Responsibilities", e no trabalho que estava a ser desenvolvido pelo NARA/RLG no âmbito da produção do TRAC, publicou em 2006 a primeira versão do NESTOR Catalogue of Criteria for Trusted Digital 428 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 16. AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories - draft for public comment. 430 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist. 431 EUA. CCSDS - Audit and certification of trustworthy digital repositories. magenta book. 432 EUA. CCSDS - Requirements for bodies providing audit and certification of candidate trustworthy digital repositories. magenta book, V.1. 433 EUA. CCSDS - Requirements for bodies providing audit and certification of candidate trustworthy digital repositories: magenta book, V.2. 434 ISO 16363:2012 - Space data and information transfer systems -- Audit and certification of trustworthy digital. 435 ISO/PRF 16919 - Space data and information transfer systems - Requirements for bodies providing audit and certification of candidate trustworthy digital repositories. 436 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories. 437 ALEMANHA. DINI Working Group “Electronic Publishing“ – DINI certificatedocument and publication services. 429 88 Repositories438, tanto em alemão como em inglês, e a segunda versão data de 2008 (a tradução inglesa é publicada em 2009). Com base neste trabalho, o grupo de trabalho DIN Working Group “Trusted Archives - Certification” desenvolveu a norma DIN 31644 “Information and documentation- Criteria for trustworthy digital archives” 439, o que permitiu o desenvolvimento do Nestor Seal for Trustworthy Digital Archives.440 A intenção do desenvolvimento de um processo de certificação e acreditação num contexto internacional e com um conjunto unificado de critérios esbarrou em pequenas mas importantes diferenças entre os critérios da lista de requisitos de auditoria do TRAC e Catálogo de Critérios do NESTOR. Por enquanto, têm demonstrado ser impraticável um único conjunto normalizado de critérios e regras aplicáveis por razões geopolíticas441, pelo que somente os critérios identificados no TRAC entraram no processo de normalização que deu origem à norma ISO 16363:2012.442 As questões da confiança, da certificação e dos instrumentos de apoio a essa certificação serão abordadas mais profundamente no capítulo 5. Interface Produtor-Arquivo Outra iniciativa do CCSDS abordou o desenvolvimento de uma descrição normalizada sobre a interface Produtor-Arquivo: ou seja, as interacções que ocorrem entre os produtores e um arquivo OAIS. Esta abordagem levou à publicação em 2004 da norma Producer-Archive Interface Methodology Abstract Standard (PAIMAS).443 A norma divide o processo de transferência de informação do produtor para o OAIS num conjunto de fases distintas, e fornece uma descrição detalhada do resultado esperado de cada fase, bem como o conjunto de acções que devem ocorrer para produzir esse resultado. Este quadro serve como base para a identificação de áreas dentro da interface do Produtor-Arquivo que beneficiariam com normas, recomendações e boas-práticas mais aprofundadas, e também fornece uma base para o desenvolvimento de processos automatizados e aplicações de software que apoiem o processo de transferência de informação. Por fim, a norma oferece uma apresentação mais detalhada das responsabilidades e funções das entidades funcionais de Ingestão e de Administração do OAIS.444 A Norma deu origem à ISO 20652:2006445, sendo uma contribuição importante para dar forma à transferência de informação do produtor para o OAIS num processo consistente e bem compreendido. Isto é particularmente útil em termos de desenvolvimento de uma compreensão mútua entre produtores e arquivos no que diz respeito às suas responsabilidades e expectativas, enquanto participantes do processo de ingestão. A 438 DOBRATZ, Susanne [et al.] – NESTOR catalogue of criteria for trusted digital repositories. ALLIANCE FOR PERMANENT ACCESS TO THE RECORDS OF SCIENCE NETWORK (APARSEN) - Report on peer review of digital repositories, p. 10; KEITEL, Christian - DIN Standard 31644 and NESTOR certification. 440 HARMSEN, Henk [et al.] - Explanatory notes on the NESTOR seal for trustworthy digital archives; KEITEL, Christian - DIN Standard 31644 and NESTOR certification. 441 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 5. 442 ISO 16363:2012 - Space data and information transfer systems - Audit and certification of trustworthy digital. 443 EUA. CCSDS - Producer-archive interface methodology abstract standard: magenta book. 444 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 16. 445 ISO 20652:2006 - Space data and information transfer systems -- Producer-archive interface : methodology abstract standard. 439 89 interface do Produtor-Arquivo está actualmente sob a forma de um projecto de norma, e foi disponibilizado aos interessados na comunidade de preservação digital para análise e comentário. Metainformação Estrutural No levantamento de actividades em curso voltadas para a preservação a longo prazo de materiais digitais, não é incomum encontrar o termo "compatível com OAIS" usado em relação a um sistema de arquivo digital. Os arquitectos da Metadata Encoding and Transmission Standard (METS)446 , um documento sobre o formato de XML de apoio à gestão e intercâmbio de objectos digitais, destacam a sua potencial utilização como uma implementação do conceito de SIP ou um DIP. Tendo nascido no âmbito do projecto Making of America II447 (1998), é uma norma de codificação cujo schema XML foi projectado para a produção de informação que expresse a estrutura hierárquica dos objectos digitais, registar os nomes e as localizações dos ficheiros que compõem esses objectos, e registar a metainformação descritiva, administrativa e estrutural associada. A última versão, 1.10448 data de Setembro de 2013, e em Setembro de 2014 vão ser discutidas as bases da versão 2.0. Para Concluir o Estado da Arte do OAIS O modelo trata igualmente da migração da informação digital para novos suportes e formatos, propondo uma tipologia da migração e analisa os riscos inerentes a cada tipo de migração proposta. Analisa também a questão dos diferentes tipos cooperação possíveis entre os arquivos electrónicos. Estes tipos de cooperação podem ir desde um simples acordo referente às normas de empacotamento dos SIPs e DIPs até à partilha de recursos materiais e aplicacionais. A cooperação entre os arquivos digitais é uma questão essencial na medida em que constitui uma forma de consolidação de normas e ferramentas utilizadas e pode ser um factor decisivo em termos de redução de custos.449 Segundo Lavoie: “The OAIS reference model is a conceptualization of the environment, functional components, and information objects associated with a system designed to effect the long-term preservation of digital materials.”450 No entanto Allinson considera que o modelo: “OAIS is not an architectural model. It is an ontology, a terminology underlying a shared view and, as such, provides a means of communication […].”451 De facto, o modelo OAIS não define qualquer implementação. Tal implementação estará, em parte, dependente da tecnologia e ferramentas disponíveis. A implementação da infrastrutura de hardware e software do arquivo evoluirá ao longo do tempo em resposta à evolução e 446 METS - Metadata Encoding and Transmission Standard. HURLEY, Bernard [et al.] - The Making of America II testbed project: A digital library service model. 448 METS – METS schema v1.10. 449 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 55-56. 450 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 14. 451 ALLINSON, Julie - OAIS as a reference model for repositories: an evaluation, p. 11. 447 90 desaparecimento das tecnologias, enquanto que o modelo OAIS deve continuar válido, servindo como guia essencial para a implementação. Note-se também quem absoluto, o modelo OAIS não está especificamente destinado aos especialistas das Tecnologias da Informação Digital: deve permitir que todos os envolvidos, directa ou indirectamente, num processo de arquivo digital compreendam a lógica geral e possam participar nele de forma efectiva.452 “However, the reference model provides a starting point for implementation, in the sense that it characterizes the high-level responsibilities, services, and informational requirements that the implemented system must, in one form or another, incorporate.”453 O modelo também fornece uma base geral que cobre a conservação de informação que não esteja em formato digital (arquivos em papel, mas também colecções de objectos na área da arqueologia, amostras de laboratório, maquetes de arquitectura, etc.). Isto é importante porque, nos próximos anos, parecendo evidente que os arquivos terão de se adaptar ao mundo digital, os documentos em papel não vão desaparecer completamente. Alguns produtores de informação podem transmitir objectos digitais enquanto outros oferecem documentos em formato analógico. Durante um período transitório, que poderá ser bastante longo, os arquivos serão, portanto, obrigados a gerir tanto informação em formato digital como em forma física.454 O modelo OAIS fornece ainda uma estrutura para descrever e comparar arquitecturas e o funcionamento de serviços de arquivos digitais. É também um ponto de partida para uma nova geração de normas especializadas que lidam com os vários aspectos dos repositórios digitais. O OAIS fornece uma visão abstracta e geral do problema, aplicável a vários contextos, o que resultou numa rápida adopção por parte de um vasto leque de comunidades profissionais: arquivos institucionais, bibliotecas, aeronáutica, pesquisa espacial.455 O modelo de referência OAIS tem sido muito bem-sucedido na consolidação da compreensão dos requisitos fundamentais para garantir a persistência a longo prazo de materiais digitais. A percepção partilhada desses requisitos é uma condição necessária para a construção de sistemas de arquivo digitais bem-compreendidos, sustentáveis, e, finalmente, confiáveis.456 Finalmente, na medida em que o modelo é amplamente reconhecido e utilizado, é um guia essencial para o desenvolvimento de software aplicacional livre e comercial no âmbito dos arquivos digitais.457 O modelo OAIS é uma base fundamental para a reflexão em cada empresa ou organização para a implementação de um arquivo digital.458 452 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 41-42. LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 14. 454 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 42. 455 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 56. 456 LAVOIE, Brain - The Open Archival Information System reference model: introductory guide, p. 17. 457 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 42. 458 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme, p. 56. 453 91 5 - Confiança e Certificação O relatório da RLG/CPA Task Force on Archiving of Digital Information (1996) referindo-se à questão da confiança no âmbito dos arquivos digitais afirma que: “For assuring the longevity of information, perhaps the most important role in the operation of a digital archive is managing the identity, integrity and quality of the archives itself as a trusted source of the cultural record. Users of archived information in electronic form and of archival services relating to that information need to have assurance that a digital archives is what it says it is and that the information stored there is safe for the long term.”459 Thibodeau, apoiando-se em Lynch (2000)460 refere que a autenticação de objectos preservados é acima de tudo uma questão de confiança e que existem maneira de reduzir o risco que acarreta confiarem alguém, mas no fundo, precisamos de confiar numa pessoa, organização, sistema ou método que exerce controlo sobre a transmissão de informação pelo espaço, tempo ou fronteiras tecnológicas. Para ele, mesmo no caso dos objectos físico duráveis, como tábuas de argila, temos de crer, que confiar, que ninguém as substituiu por falsificações.461 De acordo com o relatório Trusted Digital Repositories: Attributes and Responsibilities (2002) a Arquivística e a Informática têm definido uma série de conceitos e termos de base para definir as características dos repositórios digitais seguros. No âmbito de projectos de produção, gestão e utilização de objectos digitais, podem encontrar-se termos como “credível" [Reliable], "responsável" [Responsible], "fidedigno ou digno de confiança" [Trustworthy ] e "autêntico" [Authentic]. O debate terminológico é particularmente evidente no âmbito do desempenho, dos sistemas militares e das companhias aéreas, deu origem a novas abordagens, experiências, literatura, aplicações e ferramentas462 que ajudam na definição de características, e o desenvolvimento e manutenção de sistemas seguros de repositórios digitais.463 Mas o que querem dizer com os termos "arquivos confiáveis" ou "repositório confiável"? Para dar resposta a estas questões, será necessário abordar: - o conceito (confiança, confiabilidade, fidedignidade, etc.); - o seu significado no âmbito dos repositórios digitais; - que instrumentos existem para garantir ou pelo menos para reforçar a confiança e fidedignidade dos repositórios digitais. 459 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. 23. 460 LYNCH, Clifford - Authenticity and integrity in the digital environment. 461 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years, p. 14. 462 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 8. 463 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 8. 93 Conceitos Confiança Embora o conceito de confiança seja utilizado comumente, e seja amplamente estudado em várias disciplinas, ainda não foi alcançado um consenso total sobre a sua definição no âmbito de relações sociais que incorporam confiança e, mais concretamente, em sistemas perpetuadores de confiança 464. Autores como Rousseau465 e Gambetta466 consideram que o conceito de confiança é difícil de definir ou medir, na medida em que se revela um termo vago e com uma definição evasiva. Definir confiança no âmbito dos repositórios digitais tem é uma questão subjectiva que está dependente do contexto de utilização. As definições de "confiança" [trust] que se encontram nos dicionários incluem a "crença” [confidence] ou o “crédito” [reliance] em alguma qualidade ou atributo de uma pessoa ou coisa, ou a verdade de uma afirmação.467 Para Simmel468 estes termos estão ligados com a “fé”, enquanto que Luhman469, admitindo a relação entre esta e “confiança”, destingue-as afirmando que a confiança é algo que está relacionada com o risco e que só pode ser compreendida em relação a ele. Isto prende-se com a percepção de que as nossas actividades ou decisões podem ter como consequência acontecimentos ou resultados imprevistos, em vez de algo ligado à sorte, fado ou fortuna. Assim, apesar de tanto a confiança e a crença se referirem a expectativas que podem ser frustradas ou desencorajadas, esta consciência das circunstâncias de risco não existe no âmbito da crença, que para Luhman, tem a ver com uma atitude mais ou menos tida como certa de que as coisas familiares permanecerão estáveis. Para este autor, numa situação de confiança, o indivíduo mede as consequências e possíveis perigos, analisa as alternativas, calcula o risco, e, em situação de frustração assume parcialmente a responsabilidade e pode arrepender-se de ter depositado confiança em alguém ou algo. Esta distinção entre confiança e crença, e entre risco e perigo é assumida por Giddens470, mas refere que a confiança não se limita a um estado contínuo, sendo um tipo específico de crença [confidence].471 Este autor considera que não existe conexão intrínseca entre crença [confidence] e perigo, na medida em que este existe em circunstâncias de risco, sendo relevante para a definição deste. Face a Gambetta e Dunn472, que defendem que que a confiança é um dispositivo para se lidar com a liberdade dos outros, Giddens acrescenta que o requisito principal para a confiança é a falta de informação plena, informação esse que adviria de actividades continuadamente visíveis, processos transparentes, conhecidos e 464 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development, p. 22. 465 ROUSSEAU, Denise [et al.] - Not so different after all: across-discipline view of trust. 466 GAMBETTA, Diego - Can we trust trust?. 467 Cft. MERRIAN-WEBSTER DICTIONARY. In Merriam Webster Web site; trust in INFOPÉDIA. Dicionários Porto Editora; confiança In INFOPÉDIA. Dicionários Porto Editora; fidedigno In INFOPÉDIA. Dicionários Porto Editora; fiável In INFOPÉDIA. Dicionários Porto Editora. 468 SIMMEL, Georg – The philosophy of Money. 469 LUHMANN, Niklas - Familiarity, confidence, trust: problems and alternatives. 470 GIDDENS, Anthony - As consequëncias da modernidade. 471 GIDDENS, Anthony - As consequëncias da modernidade, p. 34. 472 GAMBETTA, Diego - Can we trust trust?; DUNN, John - Trust and political agency, no mesmo volume. 94 compreendidos.473 O autor avança a seguinte definição de confiança: “crença [confidence] na credibilidade [reliability] de uma pessoa ou sistema, tendo em vista um dado conjunto de resultados ou eventos, em que essa crença expressa uma fé na probidade ou amor de um outro, ou na correção de princípios abstratos (conhecimento técnico)”.474 Assim, a confiança existe na medida em que se considera que toda a actividade humana é criada socialmente (e não pela natureza ou por influência divina), e que a acção humana tem como intuito a transformação, derivada do dinamismo das instituições sociais modernas.475 Adicionalmente, Giddens refere que o risco pressupõe o perigo, entendido como uma ameaça aos resultados pretendidos e que a confiança serve para reduzir ou minimizar os perigos a que estão sujeitos tipos específicos de actividade.476 Assim, assumir um "risco calculado" é estar consciente das ameaças decorrentes de uma linha de acção, e, quando os padrões de risco são institucionalizados no interior de estruturas abrangentes de confiança, desenvolve-se conceito de risco “aceitável” – minimização do perigo – que é fulcral para a manutenção da confiança.477 Tal parece vir na linha de Yakel, que recupera a definição de Rousseau: “A psychological state comprising the intention to accept vulnerability based upon positive expectations of the intentions or behavior of another.”478 Neste âmbito, Giddens avança com a definição de segurança que considera ser a situação em que o conjunto de perigos está neutralizado ou minimizado e cuja experiência se traduz num equilíbrio de confiança e risco aceitável.479 Apresentando uma evolução da definição de Confiança, Yoon (2014), baseia-se em Rousseau (1998) para sustentar a existência de dois pré-requisitos: o risco, ou probabilidade percepcionada de perda, ligado ao conceito de incerteza que pode resultar da falta de informação e da existência de vulnerabilidades; e a interdependência, neste caso entre a entidade que confia e a entidade que é objecto de confiança.480 Quanto às dimensões da confiança, a autora refere que existem diferentes tipos, dependendo de diferentes factores:  Confiança baseada no cálculo, com base numa escolha racional derivada de informação credível sobre a boa intenção do outro, e que pode ser fornecida pela reputação ou certificação;  Confiança Relacional, derivada da interacção repetida ao longo do tempo entre as duas partes; 473 GIDDENS, Anthony - As consequëncias da modernidade, p. 35. GIDDENS, Anthony - As consequëncias da modernidade, p. 36. 475 GIDDENS, Anthony - As consequëncias da modernidade, p. 36. 476 GIDDENS, Anthony - As consequëncias da modernidade, p. 36. 477 GIDDENS, Anthony - As consequëncias da modernidade, p. 36 e 37. 478 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 144, cft. ROUSSEAU, Denise [et al.] - Not so different after all: across-discipline view of trust, p. 395. 479 GIDDENS, Anthony - As consequëncias da modernidade, p. 37. 480 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development, p. 22; ROUSSEAU, Denise [et al.] - Not so different after all: across-discipline view of trust, p. 395. 474 95  Confiança baseada na instituição, sentimento de segurança de quem confia, por causa das garantias de estrutura, tais como salvaguardas, regulamentos ou o sistema legal. Nos dois primeiros tipos, a fiabilidade e a confiança em interacções anteriores cria e aumenta as expectativas ou crenças positivas de quem confia acerca da entidade que é objecto de confiança.481 Nesse sentido podemos considerar que as instituições ligadas ao património cultural são fidedignas, na medida em que são responsáveis pelos materiais e objectos que compõem esse património, e também pela sua guarda, pelas condições de acesso e de garantia de preservação a longo prazo. A confiança nestas instituições baseia-se no conhecimento, experiência e prática demonstrável pela salvaguarda de objectos físicos. Mas no âmbito do património digital, dadas as suas características e desafios apresentados na sua preservação, esta confiança e garantia de fidedignidade são mais difíceis de alcançar, e muitas das instituições culturais, como bibliotecas, museus e arquivos, não estão actualmente preparadas para cumprirem com as suas funções tradicionais de armazenamento, preservação e de garantir a acessibilidade, no âmbito do património digital, tendo que recorrer a serviços especializados de entidades externas. O relatório Trusted Digital Repositories: Attributes and Responsibilities 482 refere que no âmbito dos repositórios digitais confiáveis, se aplicam três níveis de confiança: 1. Como as instituições culturais conquistam a confiança das suas comunidades designadas; 2. Como as instituições culturais confiam nos fornecedores externos; 3. Como os utilizadores confiam nos documentos que lhes são fornecidos por um repositório.483 A confiança no primeiro nível decorre da reputação que tem origem na experiência demonstrada e da expectativa que o público tem de que essas entidades vão continuar a garantir o acesso à informação de forma confiável, através do desenvolvimento contínuo de sistemas que suportam o acesso a longo prazo aos materiais. A confiança no segundo nível decorre da comprovação de confiabilidade através do cumprimento das responsabilidades contratuais e da demonstração de sensibilidade com as questões da comunidade, principalmente num quadro de certificação com base em critérios ou atributos que as entidades externas que fornecem serviços devem cumprir, para alcançarem um nível de reputação elevado. A confiança no terceiro nível decorre da capacidade de garantir a autenticidade, integridade e fidedignidade da informação digital fornecida ao utilizador. Isto passa pela garantia de detecção de qualquer modificação ao documento digital, seja ela intencional ou acidental, que o documento recebido foi o solicitado e que se pode verificar que se trata exactamente do 481 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development. p. 22-23. 482 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities. 483 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 9. 96 mesmo objecto que foi anteriormente depositado no repositório digital. Exemplos disso são fornecidos por Gladney484: a utilização de tecnologias como técnicas de detecção de erros sistemas de criptografia, e normas e boas práticas relativas a metainformação. O grupo de trabalho NESTOR (2008) refere que a confiabilidade ou fidedignidade de um sistema reside na capacidade deste operar de acordo com os seus objectivos e especificações, ou seja, que faz aquilo que diz fazer. Do ponto de vista da segurança das tecnologias da informação, ela tem como base integridade, a autenticidade, a confidencialidade e a disponibilidade dos objectos digitais. A Segurança no âmbito das tecnologias da informação é assim o pré-requisito mais importante para repositórios digitais de confiança.485 Desta forma a confidencialidade (ou segurança) diz respeito aos privilégios e permissões inerentes à utilização dos recursos de informação.486 A literatura referente à confiança e organizações na área da gestão e dos sistemas de informação consagra-se às questões da confiança dos funcionários/colaboradores e da confiança das partes interessadas externas na organização. Yakel487 parte das perspectivas da confiança organizacional no âmbito da gestão, e da aceitação da tecnologia no âmbito dos sistemas/tecnologias da informação, focando-se em três factores: 1. Confiança das partes interessadas na organização; 2. Garantias da Estrutura; e 3. Factores Sociais. O primeiro factor apresenta quatro dimensões: a benevolência, ou percepção que os clientes têm de que a organização demonstra boa vontade para com o cliente; a integridade, ou percepção que a organização é honesta e trata as partes interessadas com respeito; a identificação ou percepção de que significa que a organização compreende e internaliza os interesses das partes interessadas; e transparência, ou partilha de informação relevante para a confiança das partes interessadas O segundo factor refere-se à sensação de segurança emanada de garantias, redes de segurança, ou outras estruturas impessoais inerentes a um contexto específico488, focando-se em aspectos como o aval dado por terceiros, garantias (acções por parte da organização que os interessados entendem como mitigação de riscos), e a reputação. O terceiro factor está ligado à influência social de três tipos: Colegas ou Pares, Mentores ou colegas mais experiente, e finalmente, as Instituições. 484 GLADNEY, Henry - Perspectives on trustworthy information. BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 9. 486 DOBRATZ, Susanne; SCHOGER, Astrid - Trustworthy digital long-term repositories: the NESTOR approach in the context of international developments, p. 212; DOBRATZ, Susanne; SCHOGER, Astrid; STRATHMANN, Stefan - The NESTOR catalogue of criteria for trusted digital repository evaluation and certification. 487 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 145-148. 488 GEFEN, David; KARAHANNA, Elena; STRAUB, Detmar W. - Trust and TAM in online shopping: an integrated model. MIS Quarterly. Minneapolis, Mn. ISSN: 02767783. Vol. 27, nº. 1 (2003), p. 51-90, apud YAKEL, Elizabeth [et al.] - Trust in digital repositories. 485 97 A Confiança no Âmbito dos Repositórios Digitais Como já vimos anteriormente, o Relatório RLG/CPA Task Force on Archiving of Digital Information (1996)489 defende que para serem confiáveis, os arquivos digitais têm que demonstrar que conseguem preservar a informação e a sua autenticidade a longo prazo, enfatizando as competências e objectivos das organizações “confiáveis”, em termos de armazenamento, migração e fornecimento de acesso à informação. A necessidade de demonstração decorre do facto de que o estabelecimento de um clima de confiança junto dos vários intervenientes, desde os produtores aos consumidores, que interagem com o repositório não é suportável somente pela afirmação de capacidade de garantia de acesso continuado à informação.490 A produção do relatório Trusted Digital Repositories: Attributes and Responsibilities491 pelo grupo de trabalho patrocionado pela OCLC / RLG em 2002, e de que já se falou no capítulo 4, desperta o interesse de Granger, que no mesmo ano, tece alguns comentários no âmbito do exposto deste relatório: “The report: Proposes a definition of a trusted digital repository; Identifies the primary attributes of a trusted digital repository; Articulates a framework for the development of a certification program; Identifies the responsibilities of an OAIS-compliant digital repository; Informs the RLG/OCLC communities of other developments necessary to implement a reliable repository; and, Provides formal recommendations for future work.”492 O Trusted Digital Repositories: Attributes and Responsibilities (2002) apresentam assim a necessidade de repositórios digitais confiáveis, que definem: “A trusted digital repository is one whose mission is to provide reliable, long-term access to managed digital resources to its designated community, now and in the future.”493 Este documento considera também que os repositórios digitais confiáveis/fidedignos/de confiança podem assumir diferentes formas, que podem ir desde a opção de construir repositórios locais por parte de algumas instituições, até à opção de gerir apenas os aspectos 489 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information. 490 Cft. SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais; AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 94; BECKER, Christoph - Trustworthy preservation planning; FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital. 491 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities. 492 GRANGER, Stewart - Digital preservation and deep infrastructure. 493 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. I. 98 lógicos e intelectuais de um repositório, contratualizando o seu armazenamento e manutenção a uma entidade externa.494 A questão tem eco em Portugal, logo no ano seguinte, pela mão de Saramago (2003), que adopta ainda a definição da RLG/OCLC: “Um repositório de recursos digitais confiável é aquele cuja missão consiste em fornecer acesso a longo prazo a recursos digitais de uma designada comunidade no presente e no futuro de forma permanente e garantida.”495 A autora, bebendo do relatório do RLG/OCLC de 2002, refere que independentemente da infrastrutura de base adoptada, para atingir os seus objectivos, um repositório digital deve corresponder a um conjunto de expectativas que passam pela sua existência no Âmbito de um sistema organizacional que viabilize a preservação da informação e o próprio repositório a longo prazo, que aceite a responsabilidade da manutenção dos recursos digitais a longo prazo de acordo com os interesses dos depositantes e dos actuais e futuros utilizadores, que demonstre a responsabilidade e sustentação financeira, que o seu planeamento seja de acordo com as recomendações e normas internacionais referentes à gestão, acesso e segurança a longo prazo dos recurso digitais depositados, que defina metodologias para avaliação da qualidade dos sistemas de acordo com as expectativas de confiabilidade da comunidade, e que mantenha políticas, práticas e desempenhos auditáveis e aferidas por entidades independentes.496 Hockx-Yu (2006) refere que a confiança é um assunto que se pode tornar uma barreira importante para repositórios institucionais e aumentar a complexidade da preservação digital, e não está somente relacionada com a longevidade dos objectos digitais armazenados dentro do repositório, mas também com a sustentabilidade financeira do próprio repositório e as questões humanas ligadas à competência e confiabilidade.497 Se para o NESTOR (2006 e 2008), a segurança das tecnologias da informação é assim o prérequisito mais importante para os repositórios digitais de confiança498, o TRAC vem criticar esta definição, defendendo que é preciso olhar não só para o sistema aplicativo de preservação digital, mas para todo o sistema em que a informação digital é gerida, incluindo a organização que opera o repositório499, as práticas de gestão de objectos digitais, a infraestrutura tecnológica e a segurança dos dados, que devem ser satisfatórios e adequados para cumprir a missão e os compromissos do repositório.500 Por outro lado, o NESTOR considera que a implementação de critérios ou requisitos para o desenvolvimento de um repositório 494 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 5. SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais, p. 71. 496 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais, p. 71. Cft. BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 5. 497 HOCKX-YU, Helen – Digital preservation in the context of institutional repositories, p. 5. 498 DOBRATZ, Susanne [et al.] – NESTOR catalogue of criteria for trusted digital repositories, p. 3. BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 5. 499 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 3. 500 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 3. 495 99 digital de longo prazo que seja confiável tem que ser verificada à luz dos objectivos gerais do sistema.501 Nesta linha o TRAC afirma que um repositório digital confiável requer monitorização, planeamento e manutenção constantes, bem como acções e implementação de estratégias conscientes, no âmbito da percepção e avaliação das ameaças e riscos dentro dos seus sistemas.502 Para o NESTOR tal requer um processo de várias fases, que vão da concepção, planeamento e especificação, Execução e implementação e Avaliação, sempre num quadro de gestão de qualidade para monitorizar o processo 503, e que permita a adequação das medidas para cumprimento dos critérios. O TRAC refere que a demonstração de resultados de auditoria ao público -transparência- dará origem a uma maior confiança e auditorias objectivas adicionais, conducentes a possível certificação, irão promover ainda mais a confiança no repositório e no sistema que o suporta.504 Para o NESTOR, tal é feito pela publicação de documentação pertinente para este processo, na medida em que ajuda a aumentar a transparência e, logo, a confiança nele depositada.505 Finalmente, o TRAC não esquece um aspecto considerado muito importante: alcançar o estatuto de confiável não é uma realização de uma só vez - alcançada e esquecida. Para manter o estatuto de confiança, um repositório terá que empreender um ciclo regular de auditoria e / ou certificação.506 A certificação é já abordada na conclusão do relatório da Task Force (2002), que afirma que um componente essencial da infrastrutura de arquivo digital é a existência de um número suficiente de organizações de confiança capazes de armazenar, migrar e fornecer acesso às colecções digitais, sendo necessário um processo de certificação de arquivos digitais para criar um clima de confiança generalizado relativo à preservação de informação digital, uma vez que os arquivos digitais certificados devem ter o direito e o dever de exercer funções de salvaguarda activa, como um mecanismo de salvaguarda para preservar informação digital valiosa que está em risco de destruição, negligência ou abandono pelo actual depositário507. Esta necessidade de demonstrar e de formas de avaliar/auditar a confiabilidade do repositório transparece em Saramago (2003), que afirma: “[…] um elemento da maior importância será a existência de um processo de certificação de repositórios digitais que assegure um clima de segurança no que diz respeito ao futuro da preservação digital.”508 Seamus Ross e Andrew Mc Hugh referem mesmo que é evidente que a certificação seja uma marca que ajuda os utilizadores a determinar o nível de confiança razoável que podem ter 501 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 6. AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 3. 503 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 6. 504 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 4. 505 BERGMEYER, Winfried - nestor criteria catalogue of criteria for trusted digital repositories, p. 38. 506 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 4. 507 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. 40. 508 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais, p. 9. 502 100 num repositório digital em particular, e que a auditoria é um passo fundamental para verificar se existem condições para certificar esse repositório.509 Para o NESTOR: “A [trusted], long-term digital repository is a complex interrelated system”510, sendo a confiança uma necessidade inerente à comunidade na qual o repositório digital se insere, quer para os seus utilizadores, quer para os produtores de informação e conteúdos, quer para as entidades financiadoras que cedem os seus recursos, ou os próprios repositórios. Por essa razão a avaliação/certificação deve ter em conta as necessidades e expectativas das partes interessadas, o que também assegura um maior grau de validação universal, adequação prática para a utilização do dia-a-dia, e também uma base ampla de aceitação dos resultados obtidos.511 O PLATTER (2010) refere que o conceito de confiança tem uma definição mais clara, no sentido em que um repositório é considerado de confiança de se conseguir demonstrar a sua capacidade para cumprir com as suas funções, e se essas funções satisfazem um conjunto mínimo de critérios acordados que se supõe serem exigidos a todos os repositórios confiáveis. O requisito de comprovação de conformidade é essencial, na medida que se assume que a conquista de confiança está intimamente ligado a processos de auditoria e certificação.512 Ross513 e DRAMBORA514 referem um conjunto de elementos que constituem evidência para qualquer processo de avaliação transparente, e que podem ir desde evidência documental (como mandato de organização e da missão; exemplo de contratos de depósito, descrições de funções, organogramas e currículos dos funcionários, planos de negócios e relatórios financeiros anuais; documentos de política e manuais de procedimentos, documentos de fluxo de trabalho, planos de arquitectura técnica, relatórios de manutenção, e os resultados publicados de outras auditorias, registo de riscos, etc.), observação de práticas, testemunhos de vários agentes (Administradores, gestores da infrastrutura, gestores dos macroprocessos do repositório, depositantes e consumidores de informação) Para Prieto515, a confiança tem muitas interpretações e é um factor importante numa variedade de transacções, concluindo que os repositórios digitais podem ser fidedignos por aderirem a normas tecnológicas, práticas aceites e mecanismos para autenticação de autoria e precisão do seu conteúdo, mas, em última análise, são as percepções das suas partes interessadas - tanto os que depositam como os que usam o conteúdo - que desempenham um papel central em assegurar a fidedignidade de um repositório digital.516 509 ROSS, Seamus; HUGH, Andrew - The role of evidence in establishing trusting repositories. BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 6. 511 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 1. 512 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance (PLATTER), p. 8. 513 ROSS, Seamus; HUGH, Andrew - The role of evidence in establishing trusting repositories. 514 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment p. 29-30. 515 PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories. 516 PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 596 e p. 603. 510 101 Prieto, sustentando-se na definição da missão dos repositórios fornecida pelo documento Trusted Digital Repositories: Attributes and Responsibilities517, refere que os repositórios digitais podem assumir diversas formas, e as suas comunidades de utilizadores (depositantes e consumidores dos recursos digitais) podem também variar, tal como as suas necessidades, ou as suas práticas de trabalho, pelo que estas devem ser tidas em conta para tornar o repositório confiável. Tal concorrerá para que a percepção de confiança das comunidades de utilizador aumente a possibilidade de um repositório ter sucesso entre os depositantes e utilizadores de conteúdo.518 Para o autor, os repositórios digitais confiáveis podem ser classificados como ''de confiança'' no âmbito do processo de certificação principalmente porque eles cumprem ou excedem as expectativas e as necessidades das comunidades de utilizadores para os quais foram projectados. Isto passa pelo reconhecimento de normas e boas práticas relevantes para a sua comunidade e empresas do ramo da gestão e segurança da informação.519 O autor considera que esta definição também reconhece que componentes, como as normas, segurança e um sistema de auditorias desempenham papéis importantes no desenvolvimento de uma infrastrutura de repositório concebido para alcançar um estatuto de fidedignidade aos olhos dos gestores de conteúdo, produtores e utilizadores. Da mesma forma isso implica estabelecer metodologias para avaliação do sistema que atendam às expectativas da comunidade de confiabilidade520, bem como cumprir com as suas responsabilidades de forma aberta e explicita relativamente depositantes e utilizadores.521 O TRAC refere ainda que um repositório digital confiável deve ter estratégias de preservação documentadas. No entanto, um repositório digital confiável não pode simplesmente dizer que o fará; deve demonstrar as suas políticas, práticas e procedimentos. Nesse sentido, o repositório deve ser capaz de demonstrar que tomou decisões relevantes sobre os formatos aceitáveis, a existência de fluxos de trabalho automatizados e/ou manuais com abrangência para encaminhar objectos digitais adequados, o desenrolar de acções de preservação antecipadas e/ou aplicadas relativamente a AIPs individuais ou de grupos de AIPs, a existência de políticas, procedimentos e práticas de armazenamento de arquivo que garantam a captura e armazenamento de arquivo eficaz e de confiança, e que dêem resposta às mudanças tecnológicas inevitáveis, e que detêm meios independentes para verificar o conteúdo do repositório previsto com base num rastreio seguro dos objectos digitais recebidos.522 A pesquisa de Yakel conseguiu ainda concluir que as funções do repositório são indicadores de confiança; que a transparência é de facto um factor de confiança523; que a disciplina/área do saber e o nível de especialização afectam a percepção de confiança524; que o segundo factor 517 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p I. PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 595. 519 PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 603; Cft. AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 6. 520 Cft. BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 5. 521 PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 595. 522 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 85. 523 Cft. SCHUMANN, Natascha - Tried and trusted: experiences with certification processes at the GESIS Data Archive. 524 Cft. PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 598-599. 518 102 anteriormente apresentado (Garantias da estrutura), deve ainda incluir os aspectos de garantia de preservação (Preservação implica que determinados regimes estão em vigor para garantir o acesso contínuo aos dados) e a sustentabilidade (sustentabilidade implica que o repositório tomou as medidas para se estabelecer organizacionalmente com as estruturas de governança, financeiras e legais adequadas.); e, finalmente, que Reputação institucional é deveras importante.525 Constata-se assim que a confiança no repositório é um factor separado e distinto de confiança nos dados526. Vendo a confiança como parte integrante da relação entre as comunidades designadas e repositórios digitais, tal reflecte a qualidade das outras operações de repositório. Podemos concluir, de acordo com RAMALHO527, que um repositório se torna digno de confiança pela via da reputação, documentando todo o ciclo de vida dos Objectos Digitais que custodia e seguindo requisitos para auditoria e certificação. Responsabilidades O Trusted Digital Repositories: Attributes and Responsibilities (2002) também apresenta as Responsabilidades de um repositório digital confiável, que divide em Responsabilidade Organizacional de alto nível e de Curadoria e Responsabilidades Operacionais. A primeira responsabilidade deve ser entendida a três níveis básicos: as organizações devem primeiro identificar os requisitos que têm que cumprir; em segundo lugar devem identificar outras organizações com as quais podem partilhar essas responsabilidades; em terceiro lugar devem identificar quais as responsabilidades que podem partilhar e como. Os principais factores a ter em conta neste âmbito são:  O âmbito das Colecções;  A gestão da Preservação e do Ciclo de Vida;  O vasto leque de partes interessadas;  A propriedade material e outras questões legais;  As implicações dos custos.528 As Responsabilidades Operacionais baseiam-se na recomendação, emanada pelo relatório CPA / RLG (1996) de encetar um diálogo entre as organizações e as entidades competentes acerca das normas, critérios e mecanismos necessários para certificar os repositórios de informação digital como arquivos529, e nas responsabilidades identificadas pelo Modelo de Referência OAIS530, às quais acrescenta o papel crucial que os repositórios digitais confiáveis 525 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 153. Cft. PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 599. 527 RAMALHO, José Carlos - RODA: Repositório de Objectos Digitais Autênticos. 528 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 17. 529 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. IV. 530 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): magenta book, p. 31. 526 103 desempenham na promoção das normas desta área531, no sentido de realizar economias de escala e redução de custos, assegurando a criação de património digital de acordo com os procedimentos e práticas de preservação digital.532 Resumidamente, as responsabilidades referenciadas são:  Negociar e aceitar informação adequada da parte dos produtores da informação.533 Deve negociar os critérios que ajudam na determinação dos tipos de informação que está disposta ou é obrigada a aceitar;534  Obter um nível de controlo da informação fornecida suficiente para garantir a preservação a longo prazo;535  Definir quais as comunidades que devem ser consideradas parte da Comunidade Designada do repositório e assegurar que conseguem compreender a informação fornecida;536  Assegurar que a informação a preservar é compreensível para a Comunidade Designada, sem necessidade de recursos especiais, tal como o apoio dos especialistas que a produziram;537  Promover Boas Práticas na criação de recursos digitais, seguindo políticas e procedimentos fundamentados documentalmente e que assegurem que a informação é preservada/protegida contra todas as contingências razoáveis, no âmbito de uma estratégia aprovada;538  Disponibilizar a informação preservada à Comunidade Designada e possibilitar a sua divulgação tanto como cópias ou de forma a associá-la aos objectos de dados originais ingeridos com elementos que provem da sua autenticidade.539 Banat-Berger (2009) identifica estas responsabilidades com as dos arquivos ditos tradicionais, mas acrescenta aspectos ligados aos riscos derivados da perda da inteligibilidade da 531 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 21. BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 31. 533 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 31. 534 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 32. 535 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 31. 536 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 31. 537 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 31. 538 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 31. 539 EUA. CCSDS - Reference model for an Open Archival Information System (OAIS): Magenta Book, p. 31. 532 104 informação electrónica, e pela falta de domínio de conteúdos estáveis num ambiente instável.540 Está-se assim em condições de afirmar que esta estrutura de atributos e responsabilidades para comprovar a confiabilidade e a confiança dos repositórios digitais, é claramente influenciada pelo relatório da CPA/RLG de 1996, que, como já se viu anteriormente, pretendia que os repositórios deveriam cumprir com requisitos de certificação que garantissem prova de que cumpriam a sua função de arquivo, e que tal certificação incluiria a existência de um plano de sucessão em que um outro repositório de arquivo certificado salvaguardasse o património cultural digital: “The current repository may be a digital library, another digital archives, or some other individual, organizational, public or private source of digital information. Without the operation of a formal certification program and a fail-safe mechanism, preservation of the nation’s cultural heritage in digital form will likely be overly dependent on marketplace forces, which may value information for too short a period and without applying broader, public interest criteria.”541 Certificação Tendo abordado o conceito de confiança e o que significa no âmbito dos repositórios digitais, verifica-se que a certificação é o caminho a seguir para garantir ou pelo menos para reforçar a confiança e fidedignidade dos repositórios digitais. Falta agora referir as abordagens ou modelos e ainda os instrumentos que existem actualmente para o suporte da certificação. O Trusted Digital Repositories: Attributes and Responsibilities (2002) considera também que existem pelo menos dois modelos viáveis para a certificação de repositórios digitais confiáveis: o modelo de auditoria, aplicável a entidades que guardam documentos governamentais, especialmente os documentos de arquivo electrónicos; e o modelo de normas, que opera em vários arquivos e bibliotecas, em que as instituições envolvidas nestas actividades aderem às normas estabelecidas pelos órgãos competentes, enquanto outras entidades "certificam" o produto ou serviço através da sua aceitação e / ou uso do mesmo. No entanto, muito embora ambos os modelos funcionem bem, não conseguem resolver completamente a variedade de actividades, funções e responsabilidades relacionadas com os repositórios digitais.”542 O Trusted Digital Repositories: Attributes and Responsibilities (2002) sublinha a identificação de quatro abordagens gerais para certificação, por Bruce Ambacher (NARA), no âmbito do Archival Workshop on Ingest, Identification, and Certification Standards (AWIICS) em 1999: individual, programa, processo e dados.543 O primeiro diz respeito à certificação ou acreditação 540 BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme. Les débuts de la maturité, p. 42. 541 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. 9. 542 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 33. 543 ARCHIVAL WORKSHOP PROGRAM COMMITTEE - Archival workshop on ingest, identification, and certification standards (AWIICS) draft report. 105 dos profissionais a título individual; o segundo refere-se à certificação com base num conjunto de auto-avaliação com base numa lista de requisitos normalizados e inspecções por entidades de acreditação referentes às áreas de competência/autoridade legal, a autoridade de administração, recursos financeiros, pessoal, instalações, desenvolvimento de colecções, preservação, acesso e divulgação do acervo; o terceiro, ou seja, o Processo de certificação avalia os métodos e procedimentos que podem ser submetidos a orientações quantitativas ou qualitativas para a adesão aos requisitos internos e externos; o último, a certificação de dados aborda a persistência ou a confiabilidade de dados ao longo do tempo e segurança de dados. A Certificação para persistência de dados inclui o controlo interno e externo de qualidade, manuais de procedimentos e documentação dos processos de migração de dados, criação e manutenção de metainformação, a actualização de dados ou ficheiros, e autenticação de novas cópias. Com base em elementos de certificação referentes a cada um destas quatro abordagens, os participantes do workshop AWIICS criaram uma lista preliminar de requisitos com vista ao desenvolvimento de um programa de certificação passível de fornecer confiança544 no âmbito do esforço de normalização referente ao modelo de referência OAIS. Tanto o conceito de lista de verificação como os elementos certificáveis previstos no workshop servem de base a um quadro de certificação. Instrumentos de suporte à Certificação Como já foi referido anteriormente, o Relatório RLG/CPA Task Force on Archiving of Digital Information (1996) considera ainda que os repositórios de informação digital a que se referem estariam ligados no âmbito de um sistema de arquivo nacional através de dois mecanismos: um programa de certificação independente de arquivos baseado em normas e critérios, e que os arquivos digitais certificados teriam um mecanismo de segurança crítica para garantir a recuperação da informação digital de valor cultural.545 O Trusted Digital Repositories: Attributes and Responsibilities (2002) considera que os repositórios digitais confiáveis, independentemente das situações e responsabilidades institucionais, devem ter as suas características expectáveis enquadradas em termos de:  Conformidade com o Modelo de Referência OAIS;  Responsabilidade administrativa;  Viabilidade Organizacional;  Sustentabilidade financeira;  Adequação tecnológica e procedimental;  Segurança do sistema 544 ARCHIVAL WORKSHOP PROGRAM COMMITTEE - Certification of digital archives and preservation methodology: certification input document. 545 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. III. 106  Prestação de contas procedimental (ligada à certificação).546 As relações entre os atributos dos repositórios digitais confiáveis (TDR) são retratadas no modelo de Cornell (figura 8).547 A conformidade OAIS está implícita no diagrama. Para McGovern548, o Trusted Digital Repositories: Attributes and Responsibilities (2002) destaca a importância do contexto organizacional e coloca a tecnologia dentro desse contexto. Este posicionamento reconhece que a tecnologia deve estar adaptada ao âmbito e às necessidades de cada programa de preservação digital. O modelo de Cornell para repositórios digitais confiáveis adicionou uma " fronteira de arquivos digitais " para os atributos dos repositórios digitais confiáveis porque uma organização pode manter mais que uma instância de repositórios, devendo neste caso as camadas exteriores poderem ser coordenadas transversalmente pela organização, e várias organizações podem unir-se para gerir um repositório (por exemplo, um consórcio). Modelo de repositórios digitais confiáveis 6. Prestação de contas procedimental (certificação) 1.Responsabilidade Administrativa 2. viabilidade organizacional Fronteira de arquivos digitais 3 Sustentabilidade financeira 4.Adequação tecnológica e procedimental 5. Segurança do sistema Figura 8 - O Modelo Cornell para Atributos de Repositórios Digitais Confiáveis Tanto este modelo como o conceito de lista de verificação e os elementos certificáveis previstos no workshop servem de base a um quadro de certificação identificados no AWIICS, tiveram como consequência uma série de instrumentos de suporte à certificação que serão agora apresentados. 546 BEAGRIE, Neil [et al.] - Trusted digital repositories: attributes and responsibilities, p. 13. CORNELL UNIVERSITY LIBRARY; ICPSR; MIT LIBRARIES – Attributes of a TDR. In Digital preservation management: http://dpworkshop.org/dpm-eng/foundation/tdr/index.html. 548 MCGOVERN, Nancy - A digital decade: where have we been and where are we going in digital preservation?. 547 107 Certificação e Auditoria: o TRAC e a ISO 16363:2012 Como vimos no capítulo anterior, o Modelo de Referência OAIS e o Relatório do RLG/OCLC levou ao desenvolvimento do An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment pela Task Force on Digital Repository Certification do RLG/NARA, e, com base neste, o TRAC. De acordo com An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment e o TRAC, Cornell549 apelidou o conjunto das seguintes características ou atributos apresentados pelo relatório do RLG/OCLC (2002) - responsabilidade administrativa, viabilidade organizacional, sustentabilidade financeira e prestação de contas procedimental (certificação) - como Infra-estrutura Organizacional. De acordo com Cornell, "a infrastrutura de uma organização está melhor consagrada nas suas políticas e procedimentos", e documentação da infra-estrutura organizacional está integrada em três níveis distintos: Estrutura de política [policy framework], políticas e procedimentos [policies and procedures], planos e estratégias [plans and strategies] (Cornell, 2004).550 Os atributos ou características organizacionais são indicadores de planeamento, prontidão, capacidade de lidar com as suas responsabilidades e confiabilidade abrangentes de um repositório digital.551 A ISO 16363:2012552, que, como já se relatou anteriormente, teve origem no TRAC, apresenta a mesma configuração. A informação desta norma vai ser referenciada pelo documento homónimo do CCSDS, o Audit and Certification of Trustworthy Digital Repositories - Magenta Book553, do qual emana. Apesar de se fazer uma comparação entre estes dois documentos em capítulo próprio, apresenta-se aqui a sua organização. Para o An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment, o TRAC (e a ISO 16363:2012), a Infrastrutura Organizacional inclui elementos como Governança [Governance], Estrutura organizacional [Organizational structure], Mandato ou finalidade [Mandate or purpose], Âmbito [Scope], Funções e responsabilidades [Roles and responsibilities], enquadramento da Política [Policy framework], Sistema de Financiamento [Funding system], Questões financeiras, incluindo activos [Financial issues, including assets], contratos, licenças e passivos [Contracts, licenses, and liabilities], Transparência [Transparency]554. Verifica-se na ISO 16363:2012 a admissão de que o enquadramento da Política se prende com a Preservação [Preservation Policy Framework].555 Tanto o An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment como o TRAC organizam as métricas ou critérios da Infrastrutura Organizacional nas seguintes secções: 549 CORNELL UNIVERSITY LIBRARY; ICPSR; MIT LIBRARIES – Attributes of a TDR. In Digital Preservation Management: http://dpworkshop.org/dpm-eng/foundation/tdr/index.html. 550 AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories, p. 8; AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 9. 551 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 9. 552 ISO 16363:2012, Space data and information transfer systems - Audit and certification of trustworthy digital. Geneva: ISO. 553 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book. 554 AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories: draft for public comment, p. 8; AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 9. 555 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book. 108 “A1 Governance and organizational viability A2 Organizational structure and staffing A3 Procedural accountability and policy framework A4 Financial sustainability A5 Contracts, licenses, and liabilities”556 Por sua vez, a ISO 16363:2012, apresenta as suas “métricas normativas” ligadas à Infrastrutura Organizacional, com a seguinte organização: “3.1 Governance and Organizational Viability 3.2 Organizational Structure and Staffing 3.3 Procedural Accountability and Preservation Policy Framework 3.4 Financial Sustainability 3.5 Contracts, Licenses, and Liabilities” 557 O An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment aborda as funções, processos e procedimentos do repositório estabelecendo as métricas ou critérios ligados à ingestão e aquisição de material digital, às condições mínimas para preservação de AIPs a longo prazo, às melhores, mais actuais e estratégias de preservação documentadas e implementadas para garantir o acesso a longo prazo, aos requisitos mínimos de metainformação necessária para localização e gestão dos objectos digitais, e à funcionalidade de acesso dos repositórios. Esses critérios são organizados nas seguintes secções: “B1. Ingest/acquisition of content B2. Archival storage: management of archived information B3. Preservation planning, migration, & other strategies B4. Data management B5. Access management” 558 O TRAC inclui nas responsabilidades de gestão de objectos digitais de um repositório alguns aspectos "organizacionais" e técnicos relacionados com essas responsabilidades, nomeadamente a fase inicial da ingestão que aborda aquisição dos conteúdos digitais, a fase final da ingestão que coloca os conteúdos digitais adquiridos nos pacotes de informação de arquivo (AIPs), utilizados pelo repositório para a preservação a longo prazo, as estratégias de preservação sólidas, actuais e documentadas, juntamente com mecanismos para as manter actualizadas face à evolução tecnológica, as condições mínimas necessárias que garantam a preservação a longo prazo da AIP, o nível básico de metainformação que permita a localização e gestão dos objectos digitais no sistema, a capacidade do repositório de produzir e disseminar versões exactas e autênticas dos objectos digitais: 556 AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories: draft for public comment, p. 8; AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 9. 557 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book. 558 AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories: draft for public comment, p. 14-31. 109 “B1. Ingest: acquisition of content B2. Ingest: creation of the archivable package B3. Preservation planning B4. Archival storage & preservation/maintenance of AIPs B5. Information management B6. Access management.” 559 Quanto à ISO 16363:2012, esta adopta o título Preservação de AIP para os atributos que o TRAC define como Armazenamento de Arquivo e a preservação ou manutenção de AIP: “4.1 Ingest: Acquisition of Content 4.2 Ingest: Creation of the AIP 4.3 Preservation Planning 4.4 AIP Preservation 4.5 Information Management 4.6 Access Management” 560 O An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment aborda as questões referentes à Comunidade Designada e à usabilidade da informação, desenvolvendo métricas ou critérios ligados à existência de documentação com vista à prova e transparência, à metainformação que seja significativa para a Comunidade Designada, com vista a que a informação possa ser utilizável pelas partes interessadas, e que essa informação seja compreensível. Esses critérios são abordados nas seguintes secções: “C1. Documentation C2. Descriptive metadata appropriate to the Designated Community C3. Use & usability C4. Verifying understandability”561 De notar que este conjunto de elementos não se encontra reunido em secção própria no TRAC ou na ISO13636:2012, pelo que os critérios que dele fazem parte encontram-se espalhados pelos grupos ligados à Infrastrutura Organizacional e à Gestão de Objectos Digitais desses dois documentos. Tanto o An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment como TRAC agrupam os requisitos de tecnologias, de infra-estrutura técnica e de segurança nos critérios para avaliar a adequação da infra-estrutura técnica do repositório e sua capacidade de atender às exigências de gestão de objectos e de segurança do repositório e dos seus objectos digitais, nomeadamente os requisitos gerais de infra-estrutura do sistema, as tecnologias adequadas, com base nos requisitos da infra-estrutura do sistema, com critérios adicionais que especifiquem a utilização de tecnologias e estratégias adequadas à(s) comunidade(s) designada(s) do repositório, de sistemas de segurança, desde servidores, 559 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 2141. 560 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book. 561 AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories: draft for public comment, p. 32-38. 110 firewalls ou routers até sistemas de protecção contra incêndios e detecção de inundações, e ainda sistemas que envolvam acções humanas: No An Audit Checklist for the Certification of Trusted Digital Repositories - Draft for Public Comment: “ D1. System infrastructure D2. Appropriate technologies D3. Security” 562 No TRAC: “ C1. System infrastructure C2. Appropriate technologies C3. Security” 563 Neste grupo, a que a ISO 16363:2012 vai chamar de Gestão de Risco da Infrastrutura e de Segurança [Infrastructure and Security Risk Management], ficam unidas as infrastruturas e as tecnologias no âmbito da gestão de risco da infrastrutura técnica e aborda a Segurança também na perspectiva da Gestão de Risco, demonstração da necessidade de uma cultura de avaliação de risco como forma de garantir o funcionamento e serviço de confiança: “ 5.1 Technical Infrastructure Risk Management 5.2 Security Risk Management” 564 De acordo com Yakel, a ISO 16363:2012 apresenta um conjunto de funções ligados à selecção, processamento de dados, preservação, a adoptar pelos repositórios com a finalidade de serem considerados dignos de confiança.565 Segundo a autora, esta norma defende que as comunidades designadas têm um papel activo na verificação dos seus critérios e, logo, na construção de confiança. A título de exemplo, a secção 3.3.2 afirma que a política de preservação pode incluir informação acerca do nível de compreensibilidade esperado pela Comunidade Designada do repositório para cada AIP. De igual forma, a secção 4.2.5.2. remete para uma reacção por parte da Comunidade Designada.566 Yakel verifica ainda que, apesar da ISO 16363:2012 não corresponder quanto à forma exacta de cumprir os requisitos de auditoria, esta norma fornece sugestões quanto aos tipos de provas que considera aceitáveis para o cumprimento dos critérios definidos. No entanto, essas sugestões variam entre o muito específico e o muito genérico. Por exemplo, a secção 3.1.3 requer uma política de colecção e avança com a definição de uma política de colecção como 562 AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories: draft for public comment, p. 39-44. 563 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 4349. 564 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book. 565 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 145. 566 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 145. 111 sendo tanto a acção como a prova pretendida para o cumprimento deste critério. Em contraste, a secção 4.1.1 lista uma variedade de tipos possíveis de provas para demonstrar a identificação das Propriedades da Informação, que vão desde declarações de missão até documentos de política de preservação e fluxos de trabalho. Estes materiais de prova concernem a várias funções do repositório a diferentes níveis (administrativo, operacional, etc.).567 A própria norma defende que a comunicação dos resultados da auditoria ao público, o que considera ser um acto de transparência, gera mais confiança, e mais auditorias objectivas, promovendo ainda mais confiança no repositório e no sistema que o suporta. 568 Assim, e para Yakel, a reputação institucional é fundamental, porque ela é construída ao longo do tempo e reflecte o reconhecimento de comportamento específico, acumulado por parte de uma organização das partes interessadas.569 Sendo a Certificação pela ISO 16363:2012 um exemplo de autenticação de certificados emitidos por entidades externas, ela reforça a afirmação da importância no reconhecimento do valor em saber se uma organização está certificada de acordo com as normas ou outros controlos que podem ser relevantes para uma auditoria.570 Seguindo o raciocínio de Yakel, no ambiente do repositório, as garantias são vistas como declarações, exibidas nos sítios web dos repositório, relativas aos dados preservação e / ou sustentabilidade da organização. No âmbito da ISO 16363:2012, embora a selecção, a metainformação e o processamento de dados, sejam funções de repositório, considera-se que a preservação e a sustentabilidade são mecanismos de garantia estrutural, na medida em que aumentam a sensação de segurança e a formação de redes de segurança.571 Em resumo, dois dos factores de confiança directa - a identificação com os interesses das partes interessadas, e a transparência - parecem estar alinhadas com a ISO 16363:2012. Além disso, espera-se que os aspectos de segurança estrutural (certificados emitidos por entidades externas e as garantias derivadas da preservação e sustentabilidade), que dizem respeito à ISO 16363:2012 e ao processo de certificação possam estimular a confiança nos repositórios digitais.572 O Catálogo de Critérios Alemão: NESTOR e o Certificado DINI Como já se referiu, o NESTOR foi desenvolvido com o objectivo de ser catálogo de critérios de fidedignidade e preparar a certificação de repositórios digitais de acordo com procedimentos nacionais e internacionais. No âmbito nacional, os critérios considerados cruciais situam-se no âmbito do quadro jurídico, na existência de recursos financeiros e humanos adequados nos organismos públicos, nas estruturas organizacionais nacionais e no estado de desenvolvimento em matéria de preservação digital a longo prazo a nível nacional. A tradução das várias versões tem como objectivo ser abordado e normalizado também no contexto internacional. 567 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 145 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book, p. 2-1 569 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 147 570 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book, p. 2-2 571 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 147 572 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 148 568 112 A produção dos critérios do NESTOR baseou-se em princípios como a abstracção, para poderem ser válidos para utilização num maior espectro de repositórios, e a conformidade com a terminologia OAIS, de onde emana a maioria dos termos utilizados no âmbito dos repositórios digitais.573 Becker chama a atenção para os aspectos ligado ao planeamento a longo prazo, mecanismos ligados à mudança, e ainda a definição das propriedades significativas dos objectos digitais a preservar.574 Para além destes princípios, Dobratz e Schoger575 sistematizam outros como é o caso da necessidade de existência de documentação adequada aos objectivos, especificações e implementação dos repositórios; o incentivo à transparência, através da publicação de documentação dirigida às partes interessadas internas ou externas ao repositório, sem pôr em causa a confidencialidade de determinadas informações; a adequação dos critérios aos casos concretos dos repositórios; e a mensurabilidade não apenas no aspecto quantitativo, mas também de qualidade. No âmbito destes princípios, o catálogo proposto pelo NESTOR estrutura-se em torno de três dimensões:  O quadro organizacional do repositório;  A gestão dos objectos; e  A infraestrutura e segurança tecnológicas.576 Para além do NESTOR, foram também desenvolvidos outros projectos no quadro de certificação de repositórios digitais na Alemanha. Como se verificou anteriormente, o grupo de trabalho de Electronic Publishing do DINI desenvolveu, a partir de 2002, um processo de certificação no âmbito dos repositórios institucionais, partindo de critérios como a qualidade de serviço, a visibilidade, interoperabilidade e recurso a normas. Esta certificação estabeleceu um conjunto de requisitos mínimos para os repositórios e instituições de que estes fazem parte, abrangendo aspectos como políticas de servidor, questões legais, disponibilidade e sustentabilidade a longo prazo.577 Este processo de certificação inicia-se com o preenchimento do formulário/questionário de auditoria, cujas respostas eram posteriormente avaliadas por um especialista da informação e um perito em tecnologia, que verificavam se a certificação podia ser concedida. A verificação engloba a análise da documentação institucional e dos serviços, a existência de compromissos assumidos em termos da sua política, missão e definição de objectivos, da manutenção das características dos objectos a preservar, e ainda das questões legais como as permissões de utilização. Adicionalmente verificam a existência de preocupação em apoiar os autores, em investir numa política de indexação, não esquecendo também a disponibilização e acesso a longo prazo. O certificado DINI teve três edições, em 2004, 2007 e 2010.578 A implementação deste certificado pretende promover o 573 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 7. BECKER, Christoph - Trustworthy preservation planning. 575 DOBRATZ, Susanne; SCHOGER, Astrid - Trustworthy digital long-term repositories: the NESTOR approach in the context of international developments. 576 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 10-37. 577 DOBRATZ, Susanne; SCHOLZE, Frank. - DINI institutional repository certification and beyond. 578 ALEMANHA. DINI Working Group “Electronic Publishing“ - DINI-certificatedocument and publication services; BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 7; RECKER, Astrid - The preservation of digital objects in german repositories: three case studies. 574 113 aumento da visibilidade, o reconhecimento e importância dos serviços prestados por estes repositórios, e simultaneamente incentivar o acesso livre.579 A distinção entre o certificado DINI e projectos como NESTOR ou o TRAC prende-se, na perspectiva de Dobratz, pelo facto destes estarem mais focados no estabelecimento de critérios para a certificação da confiabilidade dos repositórios digitais no contexto da preservação digital a longo prazo, pelo facto de pretender sobretudo especificar requisitos e padrões mínimos a cumprir pelas instituições, ao nível dos documentos e publicações institucionais, estando mais focado na qualidade dos próprios serviços, na sua visibilidade e interoperabilidade. No entanto, e após a produção da segunda versão do NESTOR, o grupo de trabalho DIN Working Group “Trusted Archives - Certification” desenvolveu, em colaboração com o DIN Institute, a norma DIN 31644 “Information and documentation- Criteria for trustworthy digital archives” publicada em 2012 580, que fixou os critérios para o estabelecimento da confiança em arquivos digitais.581 Tal norma o que permitiu o desenvolvimento do Nestor Seal for Trustworthy Digital Archives.582 A norma é composta por 34 critérios baseados em quatro princípios: Documentação das actividades do repositório, transparência, adequação às necessidades das partes interessadas, e mensurabilidade dos critérios. Estes critérios dividem-se igualmente em três grupos:  Organização do Repositório digital;  Gestão de objectos a preservar;  Infrastrutura e segurança.583 Para a obtenção do Nestor Seal for Trustworthy Digital Archives, o repositório deve requerer a avaliação por parte do NESTOR, e cada um das partes nomeará representantes para contactos. O NESTOR define a calendarização do processo, e o repositório começa por fazer a autoavaliação, utilizando o formulário de verificação e as instruções para cada critério. A aplicação de cada critério deve ser verificada para o caso em questão, podendo excluir-se alguns critérios desde que tal exclusão seja justificada devidamente. Depois de determinar quais os critérios aplicáveis, o repositório deve dar resposta de forma aprofundada e comprovada documentalmente, e é classificada com base numa escala de 4 níveis referente ao grau de cumprimento:  0 (ainda não foi accionado);  3 (planeado); 579 DOBRATZ, Susanne; SCHOLZE, Frank. - DINI institutional repository certification and beyond. ALLIANCE FOR PERMANENT ACCESS TO THE RECORDS OF SCIENCE NETWORK (APARSEN) - Report on peer review of digital repositories, p. 10; KEITEL, Christian - DIN Standard 31644 and NESTOR certification. 581 KEITEL, Christian - DIN Standard 31644 and NESTOR certification. 582 HARMSEN, Henk [et al.] - Explanatory notes on the NESTOR seal for trustworthy digital archives; KEITEL, Christian - DIN Standard 31644 and NESTOR certification. 583 KEITEL, Christian - DIN Standard 31644 and NESTOR certification. 580 114  6 (planeado em detalhe);  10 (implementado). Após a auto-avaliação, a documentação é entregue ao responsável do NESTOR pelo processo, que verificará se a informação fornecida corresponde aos critérios, se é consistente, e se as soluções oferecidas são apropriadas para as tarefas e objectivos do repositório. Caso não haja questões, este emitirá um relatório, que será verificado pelo segundo revisor do NESTOR, que decidirá a atribuição do Certificado. De seguida o gabinete NESTOR e o repositório são informados, e caso este último não concorde com a decisão, pode apelar ao grupo de trabalho de certificação do NESTOR. O Selo tem validade aquando da publicação do relatório, das respostas e dos documentos no seu sítio web e após o NESTOR o acrescentar ao registo de repositórios certificados. O Selo indica o ano em que foi emitido e formalmente, a sua validade é indefinida, dependendo de futuras revisões e reavaliações.584 Os 10 Princípios Uma das primeiras tentativas de conseguir um compromisso entre várias entidades ligadas à definição de critérios ou requisitos comuns que os repositórios digitais deveriam identificar como objectivos a atingir para serem considerados confiáveis, levou a que em Janeiro de 2007, o Center for Research Libraries (CRL) organizasse uma reunião de projectos de desenvolvimento de normas e mecanismos de apoio à auditoria, certificação e acreditação de repositórios. Esta reunião, em que também participaram o Digital Curation Center (DCC), o Digital Preservation Europe (DPE) e o NESTOR resultou no desenvolvimento de um conjunto comum de critérios a que todos os repositórios de preservação digital, independentemente da sua missão, modelo de negócio e fonte de financiamento, devem seguir585: 1. Compromete-se com a manutenção continuada de objectos digitais para a(s) sua(s) comunidade(s) identificada (s); 2. Demonstra aptidão organizacional (financeira, de pessoal, de estrutura, de processos) para cumprir o seu compromisso; 3. Adquire e mantém os direitos contratuais e legais necessários e cumpre com as suas responsabilidades; 4. Tem um quadro de política eficaz e eficiente; 5. Adquire e ingere objectos digitais com base em critérios enunciados que correspondem aos seus compromissos e capacidades; 584 HARMSEN, Henk [et al.] - Explanatory notes on the NESTOR seal for trustworthy digital archives, p. 3- 6. 585 CENTER FOR RESEARCH LIBRARIES (CRL) - Ten principles; MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment – DRAMBORA, p. 16; BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 53. 115 6. Mantém / garante a integridade, a autenticidade e a usabilidade dos objectos digitais que detém ao longo do tempo; 7. Cria e mantém metainformação necessária acerca das acções tomadas sobre os objectos digitais durante a preservação, e acerca do contexto dos processos de produção, suporte ao acesso e utilização anteriores à preservação; 8. Cumpre com os requisitos de disseminação exigidos; 9. Tem um programa estratégico de planeamento e acções de preservação; 10.Tem uma infrastrutura técnica adequada para a manutenção e segurança continuadas dos objectos digitais; Becker nota que apenas um dos dez princípios refere-se directamente ao equipamento puramente técnico, ilustrando que, para os signatários destes dez princípios, a confiança tem de ser alcançada a vários níveis, que se estendem desde questões organizacionais e de planeamento estratégico até aos modelos de informação e aos requisitos de utilização.586 Avaliação de Repositórios: Data Seal of Approval Em 2010 o instituto Data Archiving and Networked Services (DANS), fundado pelo Netherlands Academy of Arts and Sciences (KNAW) e Netherlands Organization for Scientific Research (NWO), publicou as orientações que servem de base para obtenção do Digital Seal of Approval (DSA) por parte dos repositórios, e que é concedido pelo Data Seal of Approval Board.587 Este Data Seal of Approval pretende fornecer garantias aos produtores e financiadores de que os dados e materiais associados estão armazenados de forma confiável e que permanecerão disponíveis para reutilização e o seu investimento não se perderá. Permite ainda que os consumidores de dados possam avaliar os repositórios onde são mantidos os dados, e apoia os repositórios de dados no armazenamento e distribuição de dados eficientes.588 O DSA está assim orientado para a avaliação de repositórios na sua especificidade, e não para a auditoria e certificação de organizações, sendo a avaliação totalmente realizada à distância, sem a necessidade da visita de qualquer auditoria externa.589 Estas orientações, que foram actualizadas em 2013, contêm 16 requisitos para auto-avaliação e verificação pelos pares escolhidos pelo Data Seal of Approval Board, relacionados com a criação, armazenamento e (re)utilização de dados digitais.590 Tal requere que os candidatos apresentem documentação que comprove publicamente o cumprimento de cada um dos requisitos.591 Os pares que fazem a verificação são escolhidos pelo Data Seal of Approval Board, terão que comentar as 586 BECKER, Christoph - Trustworthy preservation planning, p. 17-18. MITCHAM, Jenny; HARMAN, Catherine - ADS and the Data Seal of Approval – case study for the DCC. 588 DATA SEAL OF APPROVAL BOARD – DSA Website http://datasealofapproval.org/en/information/about/. 589 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital; SCHUMANN, Natascha - Tried and trusted: experiences with certification processes at the GESIS data archive. 590 DATA SEAL OF APPROVAL BOARD – DSA guidelines 2014-2015, p. 5. 591 DATA SEAL OF APPROVAL BOARD – DSA guidelines 2014-2015, p. 6. 587 116 respostas, confirmando os documentos apresentados como elemento de prova e o nível de cumprimento ou rejeitá-lo justificando as suas razões. O processo de comentário / resposta continuará até que os pares que fazem a verificação decidam positivamente. Em caso de litígio, o requerente pode interpor recurso ao Data Seal of Approval Board.592 De acordo com Mithcham e Harman593, dos 16 requisitos, três referem-se aos produtores de dados, dez à qualidade do próprio repositório de dados, e os restantes três à utilização (e utilizadores) dos dados digitais no arquivo. Cada um dos requisitos deve ser avaliado numa escala de 0 (zero) a 4 (quatro), em que a primeira traduz-se em requisito «não aplicável» e o último significa que “o requisito foi totalmente implementado no âmbito das necessidades do repositório” em apreço.594 European Framework for Audit and Certification of Digital Repositories Uma outra tentativa de compromisso para desenvolvimento de um quadro amplamente aceite de requisitos básicos relevantes para todos os repositórios confiáveis, ocorreu em 2010 com a assinatura de um memorando de entendimento pelos seguintes grupos de trabalho ligados à certificação de repositórios digitais: CCSDS/ISO Repository Audit and Certification Working Group (RAC); Data Seal of Approval Board (DSA); e DIN Working Group “Trusted Archives Certification” ligados ao NESTOR. Este memorando deu origem ao European Framework for Audit and Certification of Digital Repositories.595 O quadro pretende apoiar as organizações na obtenção de certificação adequada como repositórios digitais confiável e estabelece três níveis de exigência no âmbito da avaliação:  Certificação Básica: auto-avaliação com base nos 16 requisitos do Data Seal of Approval (DSA);  Certificação avançada: Certificação Básica e auto-avaliação adicional verificada externamente com base nos requisitos da norma ISO 16363:2012 ou DIN 31644;  Certificação Formal: Validação da auto-certificação com uma auditoria externa oficial com base na ISO 16363:2012 ou DIN 31644.596 A atribuição destes certificados permitirá que os repositórios apresentem um dos três símbolos (a acordar) nas suas páginas web e noutros documentos, para além de quaisquer outras marcas de certificação do DSA, DIN ou ISO.597 592 DATA SEAL OF APPROVAL BOARD – DSA guidelines 2014-2015, p. 5. MITCHAM, Jenny; HARMAN, Catherine - ADS and the Data Seal of Approval – case study for the DCC. 594 DATA SEAL OF APPROVAL BOARD – DSA guidelines 2014-2015, p. 8. 595 GIARETTA, David; HARMSEN, Henk; KEITEL, Christian – Memorandum of understanding to create a european framework for audit and certification of digital repositories. 596 ALLIANCE FOR PERMANENT ACCESS TO THE RECORDS OF SCIENCE NETWORK (APARSEN) - Report on peer review of digital repositories, p. 10. 597 GIARETTA, David; HARMSEN, Henk; KEITEL, Christian – Memorandum of understanding to create a european framework for audit and certification of digital repositories. 593 117 No entanto, nada impede que os repositórios realizem auditorias internas ou até externas, devendo ter procedimentos documentados sobre todas as actividades realizadas em torno do repositório, possuir registos e evidências de todas as actividades realizadas, identificar potenciais riscos e delinear planos de contingência caso esses riscos não possam ser evitados, e finalmente, monitorizar o meio ambiente e definir planos de preservação digital (i.e. ser próactivo e não reactivo).598 Aplicação de Critérios e Certificação Tanto o TRAC como o NESTOR apresentam um conjunto de aspectos relacionados com a aplicação dos seus critérios no âmbito de uma auditoria e/ou num processo de certificação. O TRAC aconselha a utilização da lista de verificação para Auditoria e Certificação como uma ferramenta para a avaliação objectiva, seja ela feita internamente ou por um auditor externo e objectivo, e independentemente de saber se é realizada para a recolha e avaliação de informação ou como parte de um processo de certificação. A Auditoria é a base para a comparação das capacidades de um repositório digital confiável face a um conjunto de critérios fundamentais. A certificação é mais um passo que alguns repositórios tomam para o reconhecimento formal e objectivo no plano internacional ou de rede. O resultado de uma auditoria deve ser considerado no contexto em que foi realizada.599 Segundo este documento, a aplicação dos critérios deve ter em conta o contexto da instituição, sua missão, prioridades e compromissos assumidos,600 e deve articular os princípios de aplicação de quaisquer critérios: documentação, como evidência dos objectivos, do projecto, das especificações e da implementação do repositório; a transparência interna e externa para aumentar a fidedignidade; a adequação da auditoria à realidade a avaliar; e mensurabilidade com base em indicadores de confiança.601 Ainda de acordo com o TRAC, um processo de certificação deve fornecer ferramentas para permitir o planeamento, a auto-avaliação e auditoria externa. Deve reconhecer normas e boas práticas pertinentes para a comunidade do repositório, e os sectores da gestão de informação e da gestão da segurança.602 É importante ter uma norma internacional que especifique critérios face aos quais serão avaliados os repositórios, mas os processos de auditoria e certificação serão provavelmente implementado de maneiras diferentes para satisfazer as necessidades ou o contexto legal nacionais.603 598 FERREIRA, Miguel - Certificação de repositórios digitais in Seminário (r)evolução da informação pública : preservar, certificar e acessibilizar. 599 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 5. 600 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 6. 601 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 67. 602 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 7. 603 AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist, p. 7. 118 Para o NESTOR a aplicação dos critérios deve ser documentada, para poder ser avaliada, transparente, para aumentar o nível de confiança, adequada à realidade das tarefas, objectivos do repositório digital, e mensurável, com a referência dos indicadores604. Avaliação de Riscos: DRAMBORA A questão acerca do risco transparece em Portugal pela mão de Saramago (2003) que refere que o repositório digital deve gerir os riscos que ameaçam os recursos digitais, sejam eles derivados de “calamidades naturais” [sic] e sabotagens, da vulnerabilidade dos suportes, ou ainda dos riscos decorrentes das estratégias de preservação.605 Nesse âmbito, em 2007, o Digital Curation Centre (DCC) e o Digital Preservation Europe (DPE) criam a ferramenta Digital Repository Audit Method Based on Risk Assessment (DRAMBORA). Baseando-se nas listas e catálogos de critérios já existentes606, permite a identificação das competências, pontos fortes e fracos do sistema, através da análise dos objectivos e tarefas, e também dos riscos, cuja execução é medida em termos de ameaças de ocorrências [impacto negativo] e oportunidades [Risco de não ocorrências]607, e ainda das medidas implementadas para a gestão desses riscos no âmbito de um repositório digital. O documento DRAMBORA refere que: “(…) Work has continued over the past several years to define attributes of such Trusted (or Trustworthy) Digital Repositories, and the criteria that might be used to audit them. Note that trustworthy here is used in a specialist sense.”608 Este documento confirma a importância dada anteriormente, pelo relatório da CPA/RLG de 1996 e pelo documento da RLG/OCLC de 2002, no que diz respeito à certificação de confiança e fiabilidade dos repositórios para preservação a longo prazo, e admite que a maioria dos repositórios não têm as responsabilidades orientadas para o acesso e utilização a longo prazo. Ross e McHugh (2006) consideram que a pretensão deste documento era evidenciar, com base em demonstrações práticas, a existência de atributos que indicassem e medissem a qualidade dos repositórios, através de um processo de auditoria baseado na análise da documentação organizacional, na observação e no testemunho.609 O DRAMBORA assume que a Preservação Digital é um exercício de gestão de risco para converter a incerteza da manutenção da usabilidade dos objectos digitais autênticos em riscos quantificáveis. Tal implica fazer tudo para mitigar os riscos que impedem a sua capacidade de 604 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 7-8. SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais p. 75. 606 DALE, Robin; GORE, Emily - Process models and the development of trustworthy digital repositories, p. 17. 607 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 11-12. 608 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 10. 609 ROSS, Seamus; HUGH, Andrew - The role of evidence in establishing trusting repositories. 605 119 fornecer acesso à informação digital autêntica, sendo que a medida de sucesso do trabalho de um repositório é a “qualidade” da informação que dissemina aos seus utilizadores.610 Sendo o risco algo intrínseco ao que o repositório digital faz, a análise de risco e as técnicas de gestão de risco darão suporte à gestão em geral e também às suas actividades fundamentais de preservação e conservação.611 O DRAMBORA, como ferramenta de auditoria, pretende ser um complemento aos esforços de avaliação do repositório do TRAC e do NESTOR, guiar os auditores por uma série de tarefas categorizadas de acordo com as características e actividades da organização. Pretende incentivar os repositório a: 1. Identificar contexto de gestão de risco; 2. Identificar e classificar riscos com implicações mais profundas à continuidade do negócio em cada uma das suas actividades; 3. Verificar possibilidades de ocorrência e potencial impacto; 4. Determinar o sucesso de antecipar, evitar, mitigar e tratar riscos; 5. Definir medidas para responder e gerir riscos; 6. Avaliar as respostas ao risco.612 Estas fases implicam sempre a manutenção da documentação de prova (evidencial) para assegurar que as conclusões da avaliação613 são verificáveis no âmbito de uma estratégia de gestão de risco, com o objectivo de determinar se o repositório fez todos os esforços para evitar e conter os riscos que possam impedir a sua capacidade de receber, preservar e fornecer acesso a informação digital autêntica, e contextualmente compreensível, sintáctica e semanticamente, com o fim último de prevenir perdas, melhorar o desempenho, a qualidade dos serviços e a segurança.614 A conclusão da auditoria vai traduzir-se numa compreensão documentada/fundamentada da sua missão, fins, objectivos e actividades e bens intrínsecos a eles. Tal incluirá a produção de um catálogo de riscos pertinentes, categorizados de acordo com o tipo e relação entre eles e que permitirá uma identificação interna dos sucessos e lacunas da organização, para permitir a alocação ou redireccionamento de recursos para responder às situações mais problemáticas. Tudo isto permitirá a preparação do organismo para auditoria externa, seja pelo TRAC, NESTOR ou CCSDS.615 De acordo com o DRAMBORA, uma premissa fundamental subjacente nos Dez Princípios, já abordados anteriormente, é que os requisitos de preservação devem ser adaptados às 610 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 20. MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 21. 612 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 17. 613 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 24. 614 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 18. 615 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 25. 611 120 necessidades e meios da comunidade do repositório, pelo facto de estes não serem todos iguais em termos de finalidades e dimensão.616 Por outro lado, tem que ser feita uma distinção entre repositórios que são entidades próprias daqueles que fazem parte de uma organização maior, no sentido de definir (ou mesmo delegar) responsabilidades e funções no âmbito da gestão dos riscos.617 A fim de apoiar estas diferentes situações na prática de auditoria, o kit de ferramentas de auto-avaliação definiu 8 classes funcionais de actividades de um repositório digital agrupado em Actividades operacionais [Core] e actividades de suporte [Suporte]: para representar as funções básicas de um repositório digital: aquisição e ingestão, conservação e armazenamento, descrição e gestão de metainformação, acesso e disseminação; e as funções que podem ser encontrados em qualquer organização: organização e gestão, recursos humanos, gestão de finanças, apoio tecnológico e segurança. De acordo com o DRAMBORA, a definição das principais actividades, bens/recursos e a identificação dos riscos relacionados com estes, traz uma maior flexibilidade para os auditores escolherem a área do trabalho do repositório onde detêm responsabilidades.618 O DRAMBORA afirma ainda que as categorias ou classes ligadas à Segurança da infrastrutura técnica têm um significado relativamente maior para os repositórios digitais, na medida em que os principais bens/recursos do negócio do repositório - a informação digital que preserva são fortemente dependentes de uma infrastrutura técnica sólida e segura.619 O DRAMBORA permite uma autoconsciência documentada de objectivos, actividades e recursos, verificando se os recursos estão bem investidos e posicionados para o sucesso; uma compreensão documentada dos riscos, o que facilita a gestão e alocação de recursos e conhecimento da gravidade dos riscos; a definição de meios de gestão de risco e sua implementação, através de estratégias apropriadas para prevenção, o tratamento, transferência e tolerância, bem como a mecânica da sua implementação. Este processo, que deve ser repetido com regularidade, fornecerá oportunidades para estabelecer e alcançar metas quantificáveis, facilitando o desenvolvimento contínuo de todos os aspectos da actividade organizacional; e, finalmente, uma base para auditoria externas, para futura acreditação e certificação. McHugh, Ross e Innocenti (2008) referem que o DRAMBORA pretende uma abordagem do tipo base-topo, no sentido de permitir aos repositórios adaptarem a avaliação interna ao seu contexto específico, ao passo que as propostas do TRAC e do NESTOR partem de abordagens topo-base, com o objectivo de estabelecer consensos quanto aos requisitos a cumprir por um repositório digital que pretenda ser considerado confiável, revelando uma adaptabilidade mais difícil tendo em conta a grande variedade de repositórios existente. Para estes autores, tanto o TRAC como o NESTOR não distinguem claramente a auditoria da certificação – na medida em que a primeira, podendo ser precursora da segunda, tem características distintas –, e também 616 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 16. MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 16-17. 618 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 17. 619 MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment, p. 17. 617 121 não definem claramente as responsabilidades que devem ser atribuídas aos elementos envolvidos nestes processos.620 Ou seja, e de acordo com o PLATTER (2010), enquanto os grupos de trabalho do TRAC e do NESTOR produziram listas de requisitos com critérios específicos que os repositórios deveriam cumprir e comprovar documentalmente com o fim de obter certificação, a ferramenta DRAMBORA guia os repositórios durante um exercício de avaliação de risco que lhes permite auto-avaliar a sua capacidade para cumprir os seus objectivos. Cada método tem aspectos fortes e fracos. As listas de requisitos são mais concretas e específicas, logo mais apropriadas para o processo de certificação, mas são algo rígidas e pode revelar-se difícil de serem aplicadas à totalidade dos repositórios digitais que pretendem obter o estatuto de fidedignidade. Por seu lado, a ferramenta DRAMBORA é extremamente flexível porque avalia um repositório relativamente aos objectivos autodefinidos, e não a requisitos definidos externamente. No entanto isto significa que a sua fidedignidade está dependente da qualidade desses mesmos objectivos.621. Um compromisso adequado seria permitir que os repositórios identificassem os seus próprios objectivos dentro de um quadro amplamente aceite de requisitos básicos relevantes para todos os repositórios confiáveis.622 Como já se abordou anteriormente, esse compromisso resultou no desenvolvimento de um conjunto de 10 critérios comuns pelo CRL, o DCC, o DPE e o NESTOR623, e mais recentemente, no European Framework for Audit and Certification of Digital Repositories.624 No âmbito da ferramenta DRAMBORA, esses princípios determinam uma classificação dos riscos identificados pelo processo de avaliação. Para as listas de requisitos representam um esquema de classificação acordado para os requisitos a serem verificados.625 Concepção e Planeamento de Repositórios: o PLATTER O interesse na incorporação dos Dez Princípios626 ou requisitos na concepção e planeamento de um repositório que se pretende confiável logo de início deu origem, em 2010, ao Planning Tool for Trusted Electronic Repositories (PLATTER). O ciclo de planeamento PLATTER descreve um conjunto semi-formalizado de etapas destinadas a facilitar os processos de definição e apresentação dos objectivos organizacionais, e a implementação e avaliação das medidas 620 MCHUGH, Andrew [et al.] - Bringing self-assessment home: repository profiling and key lines of enquiry within DRAMBORA. 621 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 8. 622 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 9. 623 CENTER FOR RESEARCH LIBRARIES (CRL) - Ten principles; MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment – DRAMBORA, p. 16; BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 53. 624 GIARETTA, David; HARMSEN, Henk; KEITEL, Christian – Memorandum of understanding to create a european framework for audit and certification of digital repositories. 625 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 9. 626 CENTER FOR RESEARCH LIBRARIES (CRL) - Ten principles; MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment – DRAMBORA, p. 16; BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 53. 122 destinadas a conhecê-los. O PLATTER foi concebido para apoiar abordagens tanto através de lista de requisitos, como uma auditoria com base na análise de risco.627 O processo é cíclico, e as secções individuais correspondem em muitos aspectos, a etapas do processo de análise de risco DRAMBORA. As etapas do PLATTER são:  Planeamento estratégico;  Definição de objectivos ou princípios - planeamento operacional;  Implementar o planeamento;  Apresentar, rever e reformular implementação.628 O processo definido no PLATTER leva à produção de nove Planos Objectivos Estratégicos: o Plano de Negócio, o Plano de Recursos Humanos, o Plano de Dados (especificações de objectos de dados, metainformação, estruturas dos macroprocessos), o Plano de Aquisição (relação com os fornecedores e depositadores), Plano de Acessos, Plano de Preservação, Plano do sistema Tecnológico, Plano de Sucessão, Plano de Emergência.629 A ferramenta PLATTER está preocupada exclusivamente com a gestão dos objectivos e metas do repositório. Não é considerada como ferramenta para estabelecer a confiança e não se destina a competir com outras iniciativas nessa área.630 Em resumo, pode-se afirmar que, enquanto os catálogos de critérios TRAC e NESTOR estão orientadas para serem uma lista de requisitos para a certificação, as ferramentas PLATTER e DRAMBORA orientam os planeadores do repositório e apoiam-nos com mecanismos de avaliação e melhoria de alto-nível.631 O ponto de vista dos utilizadores Perante esta panóplia de instrumentos, falta perguntar como é que utilizadores, da Comunidade Designada, das partes interessadas, vão adquirindo/ganhando confiança nos repositórios, e ainda se estes consideram que as acções executadas pelos repositórios digitais, no âmbito de auditorias e certificações de fidedignidade, lhes conferem fiabilidade. Autores como Ross e McHugh (2006) 632, Prieto633 e mais recentemente, Elizabeth Yakel, Ixchel Faniel, 627 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 44. 628 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - Repository planning checklist and guidance, p. 17. 629 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - repository planning checklist and guidance, p. 20. 630 DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. HATII - repository planning checklist and guidance, p. 44. 631 BECKER, Christoph - Trustworthy preservation planning, p. 24 . 632 ROSS, Seamus; HUGH, Andrew - The role of evidence in establishing trusting repositories. 633 PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories. 123 Adam Kriesberg, Ayoung Yoon634, referem a necessidade de estudar a [percepção de] confiança dos utilizadores no que se refere aos repositórios digitais. Como já se teve oportunidade de verificar, para Prieto, os repositórios digitais confiáveis podem ser classificados como'' de confiança'' no âmbito do processo de certificação principalmente porque eles cumprem ou excedem as expectativas e as necessidades das comunidades de utilizadores para os quais foram projectados e pelo reconhecimento das normas e boas práticas relevantes para a sua comunidade.635 Este autor conclui assim que é importante, então, a estudar as percepções de confiança das comunidades de utilizadores como factores essenciais para o sucesso dos repositórios digitais. Os mecanismos e protocolos devem ter em conta o papel central que desempenham no sucesso do repositório digital, seja ele criado como repositório institucional, biblioteca digital, arquivo digital, ou qualquer outro modelo. Ao aumentar e fortalecer as percepções de confiança detidas pela comunidade de utilizadores, o conceito e o potencial do repositório digital confiável pode se tornar uma realidade ainda maior. Yakel, ao abordar a questão da confiança das partes interessadas externas na organização, ao analisar a ISO 16363:2012, afirma que, muito embora esta norma tenha a ver claramente com as acções do repositório, exige, em muitos casos, que a Comunidade Designada reconheça que são acções fidedignas conducentes à criação de confiança (critérios 3.3.2 e 4.2.5.2), e também que confirme que são respeitados princípios subjacentes ao repositório, como a transparência (critérios 3.1.3 e 4.1.1).636 Nos factores considerados por esta autora, os quais já foram referidos neste capítulo, ela identifica que, no âmbito do factor da confiança das partes interessadas, a dimensão da identificação é verificada nesta norma no requisito referente à compreensão da Comunidade Designada637, e a dimensão da transparência se verifica nos requisitos referentes à partilha de resultados de auditoria.638 Para o segundo factor (garantias de estrutura), ela dá como exemplo da aprovação/certificação dada por terceiros, o Data Seal of Approval e a certificação ISO da norma ISO 16363:2012, citando mesmo esta norma quando refere que é importante reconhecer que existe valor em saber se uma instituição é certificada de acordo com as normas ou cumpre com outros controlos que podem ser relevantes para uma auditoria.639 Esta autora também sugere que a Identificação, ou compreensão da Comunidade Designada, pode ser considerada uma métrica de verificação para a Comunidade Designada perceber o quão bem o repositório compreende suas necessidades.640 No entanto refere que o 634 YAKEL, Elizabeth [et al.] - Trust in digital repositories. PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 593. 636 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 145. 637 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 146. Cft. AMBACHER, Bruce [et al.] Trustworthy repositories audit & certification: criteria and checklist, p.21-22; EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book, p. 3-5 e 3-6. 638 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 146. Cft. AMBACHER, Bruce [et al.] Trustworthy repositories audit & certification: criteria and checklist p. 25-26; EUA. CCSDS - Audit and certification of trustworthy digital repositorie: magenta book, p. 2-1; 3-6; 3-9 - 3-10. 639 EUA. CCSDS - Audit and certification of trustworthy digital repositories: magenta book, p. 2-2. 640 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 150. 635 124 estabelecimento de métricas para o objectivo de compreensão da Comunidade DesignadaC da ISO 16363:2012 pode ser muito complexo e cheia de nuances. É importante compreender como as partes interessadas constroem confiança, na medida em que tal pode ajudar a reforçar as iniciativas de repositórios para estabelecer a confiança e é um factor para o repositório atingir a meta de ser considerado confiável.641 Ayoung Yoon 642, ao investigar como os utilizadores definem'' confiança'' em relação aos repositórios digitais, e quais os factores que influenciam utilizadores na construção de confiança e / ou mantê-la. A autora defende que a definição de confiança por parte dos utilizadores é em grande medida baseada numa falta de decepção, ou veracidade643 quando se trata do contexto específico de repositórios de dados. Em relação aos factores que influenciam o desenvolvimento de confiança nos repositórios por parte dos utilizadores, foram identificados os seguintes: características organizacionais, comunidades de utilizadores (recomendações e uso frequente), experiências passadas, os processos de repositório (documentação, limpeza de dados e verificação de qualidade), e a percepção que os utilizadores têm dos papéis do repositório.644 Para a autora, os esforços de identificação de atributos e de desenvolvimento de ferramentas de certificação reconheceram sempre o papel da comunidade de utilizadores e sugeriram formas de os envolver no processo de criação de repositórios digitais fidedignos.645 No entanto os estudos nesta área são reduzidos. A autora conclui que se o primeiro passo é perceber a confiança dos utilizadores, o passo seguinte envolve o desenvolvimento de uma métrica para medir a confiança que os utilizadores depositam nos repositórios. A confiança é um conceito complexo de medir, mas a existência de uma medição normalizada da confiança dos utilizadores pode ajudar a demonstrar como é que o repositório ganhou a confiança dos utilizadores e também como são considerados fontes confiáveis de informação. A autora sugere ainda que se deva estudar a confiança dos utilizadores nos dados.646 Para concluir o estado da arte em Certificação de Repositórios Digitais De acordo com Miguel Ferreira647, o recurso a ferramentas como o TRAC permite identificar pontos fortes, pontos fracos e formas de mitigar riscos e potenciais pontos de falha A publicação dos resultados das auditorias (internas ou externas) e restante documentação, 641 YAKEL, Elizabeth [et al.] - Trust in digital repositories, p. 154. YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development. 643 Truthfulness no original; cft truthfulness In Infopédia [Em linha]. Porto: Porto Editora, 2003-2014. [Consult. 2014-05-03]. Disponível na www: <URL: http://www.infopedia.pt/inglesportugues/truthfulness>.1. Veracidade; 2. Autenticidade; 3. boa fé ;4. exatidão; 5. Fidelidade; 6. Autenticidade 644 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development, p. 31. 645 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development, p. 21. 646 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development, p. 32. 647 FERREIRA, Miguel - Certificação de repositórios digitais. 642 125 confere maior confiabilidade ao repositório aos olhos de terceiros, indo ao encontro do princípio da transparência. Actualmente não existem entidades certificadoras de repositórios pela ISO 16363:2012, estando somente o DSA e o DINI a dar os primeiros passos como entidades certificadoras com os seus conjuntos de critérios de certificação. Os instrumentos de suporte à certificação analisados neste capítulo têm motivado o desenvolvimento de várias outras ferramentas, e a adaptação de aplicações informáticas, com o objectivo de auxiliar as organizações no planeamento dos seus repositórios, principalmente no que concerne ao estabelecimento e incremento da confiança entre a comunidade de interesse. São disso exemplo a ferramenta PLATO, que será abordada no âmbito do capítulo 6, ou o projecto DCAPE-Distributed Custodial Archival Preservation Environments648, que não teve posteriores desenvolvimentos. No caso de Portugal, a comunidade académica tem acompanhado as tendências internacionais no desenvolvimento e implementação de repositórios institucionais. Apesar de não estarem ainda em prática medidas concretas para a realização de auditorias e certificação desses repositórios, há consciência, por parte da comunidade envolvida, da necessidade de estabelecimento de políticas formais de preservação, assegurando as características de autenticidade, integridade, e acessibilidade dos documentos digitais, e simultaneamente desenvolvendo elementos que permitam o incremento da confiabilidade dos repositórios, abrindo o caminho para futuros processos de certificação.649 A manutenção da assinatura digital. Adicionalmente aventa-se aqui a possibilidade da certificação de repositórios digitais permitir uma evolução positiva nas situações ligadas ao risco que acarreta a utilização de documentos de arquivo electrónico com assinatura electrónica como elemento probatório a longo prazo. A assinatura electrónica qualificada constitui um meio de autenticação digital equiparável à autenticação através da assinatura convencional (escrita), mas, ao contrário desta, tem um prazo de validade limitado, de acordo com as especificações e critérios de cada entidade certificadora.650 Ora estando a leitura da assinatura electrónica dependente de um sistema intermediário, é possível que a evolução tecnológica leve à obsolescência do software e hardware que interpreta a assinatura, o que retira validade probatória ao documento.651 Por outro lado os certificados digitais que suportam a assinatura digital652, e que são emitidos por uma entidade certificadora653 que garante não só a associação de uma assinatura digital com um determinado individuo como a autenticidade e inviolabilidade da assinatura digital, assumem a manutenção da autenticidade do documento através da inalterabilidade da 648 HOU, Chien-Yi; WOJCIK, Caryn; MARCIANO, Richard - Trusted digital repository design: a policy-driven approach. 649 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital. 650 DECRETO-LEI 290D/99 de 2 de Agosto; DECRETO-LEI 68/2003 de 3 de Abril; DECRETO-LEI 165/2004 de 6 de Julho; DECRETO-LEI 116-A/2006 de 16 de Junho; DECRETO-LEI 88/2009 de 9 de Abril. 651 MARTINS, Francisco – Preservação digital: novos desafios na justiça. 652 DECRETO REGULAMENTAR 25/2004 de 15 de Julho. 653 DECRETO-LEI 116-A/2006 de 16 de Junho. 126 informação a nível lógico. Como a obsolescência tecnológica pode tornar o objecto ininterpretável e mesmo inacessível, será necessário aplicar medidas de preservação digital, medidas essas que, não alterando o objecto digital a nível conceptual, produzem alterações a nível lógico, o que constitui uma quebra da garantia fornecida pela assinatura digital. É da nossa opinião que apenas através da sistematização das medidas de preservação digital em sede de um plano de preservação digital, apoiando-se em repositórios digitais certificados que assegurem a evidência do valor probatório dos documentos, será possível resolver o conflito entre a obsolescência dos certificados das assinaturas digitais e o valor evidencial a longo prazo dos documentos que contêm essas assinaturas digitais. Neste âmbito verifica-se a necessidade de reformular e repensar o conceito de autenticidade e integridade que está na base da legislação sobre a assinatura electrónica, na medida em que, de acordo com Miguel Ferreira: “num contexto digital, a autenticidade não terá tanto que ver com o demonstrar que um objecto é original, mas sim, que está conforme o original.”654 A solução proposta requer igualmente legislação que confirme e legitime a existência de um repositório digital certificado com responsabilidades na custódia e emissão de cópias certificadas dos documentos nele ingeridos e geridos. Nesse âmbito a Direcção-Geral de Arquivos, actual Direcção-Geral do Livro, dos Arquivos e das Bibliotecas, apresentou em 2011 uma proposta para Serviços de Arquivo Confiáveis: preservação de informação digital autêntica e autenticada, que implicaria a possibilidade de certificar repositórios de acordo com referenciais normativos internacionais e incluí-los no texto da lei de forma a criar opções efectivas para preservação digital, a possibilidade de credenciar instituições certificadoras, de acordo com normativos internacionais, de forma a terem competências para reconhecer repositórios como certificados, a aceitação de cópias certificadas como documentos com valor probatório idêntico a “originais” desde que custodiados por um repositório certificado, a possibilidade de assinatura digital ser extraída no momento da ingestão do documento no repositório certificado através de um processo totalmente documentado através da criação de metainformação emitida pelo repositório (mantendo o documento “original” com a assinatura digital, embora sem preservação associada), e a regulamentação como solução (adicional) de preservação digital a longo prazo para documentos assinados digitalmente dos TAS – Serviços de Arquivo Confiáveis, de acordo com o indicado pelo grupo de trabalho European Electronic Signature Standardization Initiative (EESSI) 655 654 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico, p. 37. 655 NILSSON, Hans [et al.] - Final report of the EESSI expert team. 127 6 - Repositório de Objectos Digitais Autênticos (RODA) O Repositório de Objectos Digitais Autênticos tem origem no projecto homónimo, e do qual fizemos parte, desenvolvido entre 2006-2008, pelo Instituto de Arquivos Nacionais/Torre do Tombo (IAN/TT), depois elevado a Direcção-Geral de Arquivos (DGARQ), que foi fundido mais recentemente na Direcção-Geral do Livro, Arquivos e Biblioteca (DGLAB). A missão desta instituição inclui responsabilidade pela identificação e preservação de documentação de valor histórico como meio de garantir e fomentar a memória individual e colectiva nacional e assegurar o valor evidencial da documentação produzida pela Administração Pública. Tal documentação inclui informação digital produzida no âmbito das iniciativas do Governo Electrónico para agilizar e assegurar um serviço mais rápido, completo e transparente para os cidadãos. Por esse motivo o IAN/TT considerava necessário desenvolver processos, ferramentas e recursos capazes de dar resposta às necessidades de preservação dessa informação digital, num processo sustentado e pró-activo que permitisse dar resposta às solicitações governamentais e comunitárias no sentido do governo electrónico. Os financiadores originais do RODA foram o POAP (Programa Operacional da Administração Pública), um instrumento financeiro nacional, financiado pela União Europeia (75%), e a Direcção-Geral de Arquivos (25%). O POAP visava a inovação organizacional, a simplificação dos procedimentos administrativos, melhorando a qualidade dos serviços públicos e formação de pessoal na administração central. O Projecto O projecto RODA, que contou com a colaboração informática da Universidade do Minho, tinha como finalidade desenvolver e promover uma solução tecnológica, ultimada na construção de um protótipo de repositório digital que desse origem a ideias e a um conhecimento mais concreto de como construir um repositório de preservação digital real656 capaz de incorporar, descrever e dar acesso a todo o tipo de informação digital produzida no contexto da Administração Pública.657 Foram planeadas três macro-fases, a saber Análise e Planeamento, Prototipagem e, Teste e Disseminação, cada uma composta por várias tarefas.658 O projecto considerou como objectivos primários o desenvolvimento e a definição de: requisitos funcionais para um arquivo digital, clientes e aplicações a integrar; modelos conceptuais, lógicos e de dados de um arquivo digital; Identificação e selecção de esquemas de metainformação para as diferentes camadas de metainformação; Requisitos técnicos e organizacionais; protótipo dum arquivo digital para preservar objectos digitais susceptíveis de conservação definitiva; elaboração de uma ferramenta, enquanto módulo da anterior, capaz de se "acoplar" com sistemas de gestão documental existentes na AP e assegurar funções de preservação digital numa perspectiva de gestão administrativa. Foram também identificados objectivos secundários, como a definição de uma política de arquivo para os objectos digitais produzidos pela Administração Pública nacional (avaliação e 656 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade, p. 5. BARBEDO Francisco [et al.] – RODA: Repositório de Objectos Digitais Autênticos. 658 FARIA, Luis e CASTRO, Luis – RODA Repositório de Objectos Digitais Autênticos – relatório final,p. 5. 657 129 selecção); a definição de uma política de preservação para o arquivo digital; a criação ou identificação de modelos de financiamento viáveis para suportar o Arquivo Digital; a definição de uma taxionomia de propriedades significativas para cada uma das classes de objectos consideradas. O protótipo foi planeado tendo por base as funcionalidades indicadas no modelo de referência OAIS, e em conformidade com a METS (Metadata Encoding & Transmition Standard), a EAD (Encoded Archival Description), a PREMIS (PREservation Metadata: Implementation Strategies), e as recomendações do InterPares.659 Posteriormente à produção do protótipo foi desenvolvido um sistema de repositório, de acordo com os princípios e requisitos refinados na fase anterior. Foram consideradas três classes de objectos digitais: documentos de texto estruturado, imagens estáticas bidimensionais e bases de dados relacionais (MS SQL Server, MS Access, PostgreSQL, MySQL e ODBC genérico), para os quais foram definidos formatos de preservação, respectivamente o PDF/A-1660, o TIFF661 e o DBML.662 O estudo das taxonomias também permitiu verificar que a preservação de bases de dados implica a separação lógica e física dos dados relativamente ao sistema que os gere, pelo que é necessário metainformação acerca dos formulários e relatórios existentes no sistema que continha os dados da base de dados. Metainformação no RODA A metainformação escolhida no âmbito do projecto dizia respeito às camadas de metainformação descritiva, que cumpre o propósito de os materiais estarem bem organizados e facilmente localizáveis, estando assim ligada à função de acesso, a metainformação técnica, para detectar eventuais falhas no processo de preservação e auxiliar a tomada de decisão quanto à estratégia de preservação a implementar, metainformação estrutural, ligada ao processamento e interpretação do objecto de forma coerente e correcta, e metainformação de preservação, referente à garantia de autenticidade. Os esquemas de metainformação identificam-se com o EAD versão de 2002663, para a metainformação descritiva, o PREMIS 1.0 (PREservation Metadata: Implementation Strategies)664 para a metainformação de preservação, o Esquema NISO Z39.86665 para a metainformação técnica para caracterizar imagens digitais, e o esquema METS (Metadata Encoding & Transmition Standard)666 e ainda o esquema RDF (Resource Description Framework)667 para a metainformação estrutural. 659 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade, p. 5 e p. 7. ISO 19005-1:2005, Document management – Electronic document file format for long-term preservation: Part 1: Use of PDF 1.4 (PDF/A-1). 661 ADOBE - TIFF developer information site. 662 HENRIQUES, Marta [et al.] - Bidirectional conversion between XML documents and relational data bases. 663 Encoded Archival Description. 664 CAPLAN, Priscilla [et al.] - Data dictionary for preservation metadata: final report of the PREMIS working group. 665 ANSI/NISO Z39.87-2006, Data Dictionary - Technical metadata for digital still images. 666 METS - Metadata Encoding and Transmission Standard. 667 RDF - Resource Description Framework. 660 130 Assim, o RODA considera como esquemas de metainformação primários o EAD e o PREMIS. O EAD permite descrever as Entidades Intelectuais, isto é, as representações, e as relações hierárquicas, sustentadas nos respectivos planos de classificação, sendo o nível mais baixo de descrição permitido o documento composto ou documento simples. Por sua vez o PREMIS, guarda metainformação relativa à preservação digital, descrevendo representações, agregado de ficheiros necessários para renderizar a entidade intelectual, e ainda os ficheiros que constituem essa entidade Intelectual, e que são o verdadeiro alvo dos processos de preservação. O PREMIS inclui ainda dados acerca dos Eventos, que registam as acções que ocorrem sobre os objectos e o resultado dessas mesmas acções, mas também sobre os Agentes responsáveis pela execução das acções que produzem os referidos Eventos. Mas uma vez que o PREMIS é um esquema generalista que não guarda metainformação técnica específica acerca de qualquer tipo de ficheiro, é necessário utilizar um esquema de metainformação técnico específico para cada tipo de ficheiros alvo de preservação, o que no caso das imagens digitais estáticas é o esquema NISO Z39.87. De igual forma, é usado ainda outro tipo de metainformação estrutural para objectos digitais constituídos por vários ficheiros que devem estar organizados por uma determinada ordem e/ou agrupamento. Neste caso, o esquema METS guarda a informação sobre a ordem das imagens (páginas) e também sobre a divisão em subgrupos (organização interna) dos ficheiros de uma representação, tendo a função de ponto de acesso a esta representação, permitindo a navegação pelos vários ficheiros da representação de uma forma ordenada. Este esquema transparece como um envelope que acompanha pacotes de submissão de informação (SIP). O RDF é utilizado para criação de relações entre objectos de descrição, preservação e representações. Baseando-se no projecto INTERPARES, definiu-se a migração como estratégia fundamental de preservação, utilizando conversores para migrar os formatos em perigo de obsolescência. Tal assume que a autenticidade dos objectos digitais não se possa basear na sua originalidade, mas na sua fidelidade relativamente ao original. Tal implica que a garantia de fidelidade requeira a avaliação dos objectos digitais aquando de cada migração, devendo estas migrações ser bem documentadas, nomeadamente no que diz respeito a perdas, por forma a manter a sua autenticidade. O registo das tarefas ligadas à preservação fica guardado no RODA, seguindo o esquema PREMIS.668 Plataforma de Desenvolvimento A selecção da plataforma de desenvolvimento levou a uma análise de projectos de arquitecturas de repositórios que fossem open-source, destacando-se o DSpace e o Fedora. Estes candidatos foram avaliados e comparados tendo por base os requisitos funcionais do RODA. Estes requisitos estão divididos em três tipos distintos, ligados aos macroprocessos identificados no Modelo de Referência OAIS - Ingestão, Gestão, Disseminação – e cada um deles indicava um componente do RODA que comprovaria a cumprimento do requisito. A avaliação e comparação verificaram que o DSpace implementa mais requisitos do que o Fedora, o que levou a pensar que seria o mais apropriado. No entanto, verificou-se que o DSpace apresentava uma estrutura de dados interna demasiado específica que dificultava a 668 FARIA, Luis e CASTRO, Luis – RODA Repositório de Objectos Digitais Autênticos – relatório final, p. 2021. 131 possibilidade de o adequar às necessidades do RODA, como a inclusão dos esquemas de metainformação escolhidos. Tal rigidez, oposta à flexibilidade do Fedora, derivada da ausência de ferramentas ou serviços, levou a que a equipa do RODA opta-se pela segunda opção. A escolha do Fedora obrigou a um maior trabalho de implementação das funcionalidades a adicionar, quando em comparação com uma solução menos genérica. Assim, o RODA está organizado em várias entidades funcionais de acordo com o modelo de referência OAIS, e a sua arquitectura interna baseia-se na arquitectura do FEDORA Commons, uma plataforma de código-aberto que disponibiliza um conjunto de serviços básicos que permitem o desenvolvimento de repositórios digitais altamente parametrizáveis. Os serviços disponibilizados pelo Fedora Commons são responsáveis por tarefas elementares ao nível das entidades funcionais de Gestão de Dados e de Armazenamento de arquivo, e incluem a capacidade de ingerir, aceder e eliminar objectos digitais, bem como estabelecer relações entre estes através de mecanismos ontológicos baseados em RDF. O Fedora inclui um motor de pesquisa capaz de indexar o conteúdo dos vários objectos armazenados permitindo assim a sua posterior localização e recuperação. O RODA guarda um registo de todas as acções desenvolvidas em torno do repositório. Essa informação é armazenada numa base de dados e em ficheiros armazenados no sistema de ficheiros. Toda esta camada de componentes é apelidada de Serviços de Dados RODA (RODA Data Services). Sobre os serviços anteriormente descritos foram desenvolvidos métodos remotos mais complexos que implementam a lógica de negócio do repositório, como o RODA Core Services. O RODA Core Services é responsável pela execução de tarefas como lidar com o fluxo do processo de ingestão, formas avançadas de consulta ao repositório e execução de funções administrativas no repositório. Estes métodos encontram-se acessíveis através de vários Web services organizados de acordo com o modelo de referência OAIS. Isso permite integração de sistemas já existentes na organização, que poderão depositar ou consultar informação disponível no repositório. Além disso, esta API permite a criação de novas ferramentas de ingestão que criam e depositam SIPs de forma automática no RODA. A interface com o utilizador é assegurada pelo componente RODA Web User Interface (RODA WUI). Este componente faz uso dos serviços disponibilizados pelo RODA Core e apresenta uma interface gráfica que permite aos produtores, consumidores, arquivistas, e administradores de sistema interagir com o repositório. Os subcomponentes que constituem RODA WUI são baseados no Google Web Toolkit. O mecanismo de autenticação implementado pelo RODA assenta no recurso a um servidor LDAP (Lightweight Directory Access Protocol). Paralelamente ao RODA Core Services existe um conjunto de serviços de migração e serviços relacionados com as acções de preservação e manutenção, como a normalização de formatos, verificação de integridade, despiste de vírus, tarefas administrativas, activação de alertas, cálculo de estatísticas, etc. As ferramentas de preservação digital permitem a validação e caracterização dos objectos digitais, comparação entre objectos originais e os derivados da sua conversão, processos de migração para vários formatos, que incluem a identificação do formato e outras propriedades do objecto digital. 132 A Gestão da Preservação dentro do RODA é gerida por uma agenda de tarefas em que um utilizador especial, ou seja, o especialista de preservação, pode definir o conjunto de regras que desencadeiam acções de preservação específicas. As acções de preservação respeitam uma API comum, por isso a criação e instalação de novas acções no repositório é tão simples como copiar o ficheiro de programa para pasta correta no servidor. Estas acções podem invocar serviços remotos, mas devem ser implementados localmente por uma questão de conformidade com os requisitos. Estas acções devem lidar com todos os pedidos de serviços remotos e lidar com todas as possíveis excepções que possam ocorrer. A agenda de tarefas permite que o perito de preservação configure as regras que irão seleccionar objectos relevantes para uma intervenção de preservação, bem como o agendamento da própria intervenção. Uma das características do RODA como sistema distribuído é a possibilidade de ser implantado de diferentes maneiras, desde correr todos os componentes num servidor, até correr cada componente num sistema diferente. A implantação do RODA em diversos sistemas aumenta o seu desempenho e segurança. Pacotes de Informação Assim, o FEDORA considera a unidade de informação como o objecto, pelo que toda a informação, incluindo a metainformação, terá que fazer parte de um ou mais objectos. Um objecto está estruturado em 4 partes: o PID, ou identificador único e persistente; a Descrição, necessária para a gestão interna dos objectos, e que inclui as propriedades do Objecto e a metainformação acerca das suas Relações; Itens, o conjunto de metainformação contido no objecto e Serviços, as funcionalidades associadas ao objecto, nomeadamente o serviço de disseminação, que disponibiliza o acesso às propriedades e aos objectos.669 Com base nesta estrutura, cada SIP que o RODA ingere é composto por uma ou mais representações, um registo de metainformação descritiva por cada representação 670 e restante metainformação de preservação e técnica (se existente). Todos esses ficheiros são acompanhados de um envelope METS para lhes dar ordem e estrutura. Todos esses ficheiros são comprimidos num ficheiro ZIP, que constitui o SIP.671 Antes do SIP ser incorporado no RODA, passa por uma série de teste depois de ser descomprimido, e que incluem o despiste de vírus, validação sintáctica e estrutural, verificação de completude do SIP e integridade dos ficheiros, validação da metainformação descritiva e de preservação, verificação de existência das representações, verificação de permissões do produtor, normalização dos formatos. 669 FARIA, Luis e CASTRO, Luis – RODA Repositório de Objectos Digitais Autênticos – relatório final, p. 3234. 670 Uma vez que o esquema EAD é utilizado para descrever uma colecção inteira de representações, verifica-se que cada registro EAD não descreve somente uma representação. Assim a equipa do RODA optou por um subconjunto do esquema EAD, o EAD-C, suficiente para descrever uma representação, ou seja, um elemento <c> e todos os seus sub-elementos. 671 FERREIRA, Miguel - RODA: descrição do sistema, p34; FARIA, Luis [et al.] - RODA : a service-oriented repository to preserve authentic digital objects, p. 3-4. 133 Após ser validado, o SIP é então desmontado e cada um dos seus componentes é integrado no repositório. Findo este procedimento, o SIP torna-se um AIP e está pronto para ser disseminado para potenciais consumidores que têm autorização para aceder a essa informação. O consumidor tem a possibilidade de pesquisar as colecções disponíveis para visualizar ou descarregar as representações digitais custodiadas no repositório. Com esse fim, são utilizados diferentes módulos aplicacionais para visualização ou disseminação, tendo em conta o tipo do objecto digital. Modelo de Dados O modelo de Dados do RODA distingue três tipos de objectos: Objectos de Descrição (OD), Objectos de Representação (OR) e Objectos de Preservação (OP). O AIP é ilustrativo do modelo de dados do RODA, verificando-se ser atomístico e baseado no modelo definido pelo PREMIS. Com efeito, cada Entidade Intelectual é descrita por um registo de metainformação EAD-C, designado por objecto de descrição. Estes objectos de descrição relacionam-se hierarquicamente entre si de forma a constituir uma descrição completa de um Fundo de arquivo, mas são mantidos separadamente dentro do modelo de conteúdo Fedora Commons. Estas relações são criadas usando o mecanismo de ligação RDF fornecido pelo Fedora. Adicionalmente, cada objecto de descrição do tipo documento ou documento composto possui relações com um ou mais objectos de representação. Um objecto de representação é um objecto Fedora que incorpora todos os ficheiros e sequências binárias que constituem uma representação digital. Finalmente, cada um destes objectos encontra-se relacionado com um terceiro tipo de objectos designados por objectos de preservação. Estes têm como objectivo documentar a proveniência da representação digital e o historial de eventos de preservação que ocorreram no interior do repositório. Os objectos de preservação podem ser de quatro tipos distintos: objecto, evento, evento com relacionamento, e agente. Os objectos de preservação do tipo objecto registam a estrutura da representação e informação técnica sobre os ficheiros que as constituem. Os objectos do tipo agente descrevem qualquer pessoa, organização ou aplicação de software que tenha sido responsável pela realização de um evento. Por sua vez, um evento agrega toda a informação relativa a uma acção de preservação (e.g. verificação de integridade, migração, etc.), bem como o resultado da mesma (e.g. sucesso, insucesso, etc.). Os objectos do tipo evento com relacionamento são utilizados para documentar eventos que originam as novas representações. Exemplos disto são os eventos de migração. Trata-se de eventos que são aplicados a uma representação e cujo resultado é uma nova representação derivada da primeira. 134 Verifica-se assim que o RODA implementa totalmente o macroprocesso de Ingestão que não só valida SIPs, mas também cuida de todo o processo de negociação entre o arquivo e os produtores da informação. O RODA também é responsável pelo Acesso, fornecendo diferentes formas de pesquisa e navegação sobre a metainformação disponível, bem como visualização / transferência de objectos digitais armazenados. Também foram desenvolvidos componentes de Administração que permitem que os arquivistas alterem a metainformação descritiva e definam regras para as intervenções de preservação, como agendamento de verificação de integridade de todos os objectos digitais armazenados, iniciar o processo de migração de determinadas classes/ formatos de representação, ou controlar quais utilizadores ou grupos estão autorizados a realizar certas acções dentro do repositório.672 Planeamento de Preservação: o CRiB Embora o RODA cubra a maior parte dos componentes funcionais descritas no modelo de referência OAIS, ainda faltava um componente muito importante, o Planeamento de Preservação.673 Assim a equipa do RODA tomou proveito do projecto CRiB (Conversion and Recommendation of Digital Object Formats), desenvolvido na Universidade do Minho com a intenção de ajudar organizações no planeamento e execução de operações de preservação baseada na migração.674 Trata-se de uma Arquitectura Orientada ao Serviço (SOA) suportada por Web Services que permite aos actuais repositórios realizar migrações de formatos, determinar a quantidade de informação perdida numa migração, documentar a intervenção de preservação e obter sugestões de alternativas de migração adequadas ao problema de preservação em causa.675 O Planeamento da Preservação é suportado por um serviço de recomendação que toma decisões informadas sobre as melhores opções de migração disponíveis e toma em consideração as necessidades individuais de cada instituição cliente. O componente de execução de preservação é tratado por um grande conjunto de serviços de migração que pode ser constituído para gerar fluxos de migração mais complexos.676 Apresentamos resumidamente os seus componentes constituintes: - O Identifier Format, que é um serviço capaz de identificar a codificação subjacente a uma representação digital, garantindo que as aplicações clientes responsáveis pela preservação de objectos digitais sejam capazes de identificar, caracterizar e validar a integridade dos seus objectos sem intervenção humana. Além disso, permite que as descrições de formato sejam uniformizadas em todos os componentes do CRiB de acordo com o vocabulário controlado 672 RAMALHO, José Carlos [et al.] - RODA and CRiB a service-oriented digital repositor; BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade, p. 7. 673 RAMALHO, José Carlos [et al.] - RODA and CRiB a service-oriented digital repositor. 674 FERREIRA, Miguel; BAPTISTA, Ana Alice; RAMALHO, José Carlos - A foundation for automatic digital preservation. 675 FERREIRA, Miguel, BAPTISTA, Ana Alice, RAMALHO, José Carlos - CRIB : a service oriented architecture for digital preservation outsourcing. 676 RAMALHO, José Carlos [et al.] - RODA and CRiB a service-oriented digital repositor. 135 definido pelo registro de formatos PRONOM desenvolvido pelos Arquivos Nacionais do Reino Unido;677 O Obsolescence Notifier é responsável pela monitorização do nível de (falta de) utilização dos formatos reconhecidos. Quando um determinado formato está em risco de se tornar obsoleto (por exemplo, quando é publicada uma nova versão de um formato), este componente fará accionar os eventos de preservação adequados. O Service Registry gere a metainformação de suporte à descoberta de serviços, baseada na norma UDDI (Universal Description, Discovery and Integration), informando o CRiB dos serviços de migração disponíveis e prontos a serem utilizados. O Migration Broker está responsável pela invocação de serviços de migração e pela medição da performance de cada um desses serviços em termos de disponibilidade, estabilidade, escalabilidade, débito e custo. O Object Evaluator verifica a quantidade de informação perdida na migração, tendo por base múltiplos critérios de avaliação e propriedades significativas, como por exemplo, o conteúdo textual, dimensões da página, número de páginas, layout gráfico, tamanho da fonte, etc. Este componente emite de relatórios para o cliente, baseados no PREMIS Data Dictionary (Event Entity), indicando a data e hora da intervenção, descrição dos agentes envolvidos, tipo de evento (e.g. migração) e o resultado da intervenção. O Format Evaluator informa o sistema sobre o estado dos formatos digitais ao nível de cota de mercado, nível de suporte, existência de especificação aberta, etc., para o Migration Advisor decidir quais os formatos mais adequados para a preservação a longo prazo. Utiliza como fontes de informação bases de dados com factos sobre formatos e outras fontes dinâmicas de informação como o PRONOM Registry ou o Google Trends. O Migration Advisor é o responsável pelo planeamento da preservação. Para tal gera sugestões de alternativas de migração, combina os requisitos de cada organização cliente (como a importância atribuída a cada propriedade significativa) com o conhecimento que acumula sobre a qualidade de cada conversor usado para migração, em termos de desempenho, perda de informação associada e estado de cada formato. O CRiB apresenta-se como uma plataforma de avaliação, recomendação e selecção de alternativas de migração, que presta serviços de conversão/migração e avaliação dos resultados dessa conversões/migrações. Adicionalmente, produz relatórios para anexação à metainformação de preservação, que servem como documentação da intervenção e garantem a autenticidade. Permite a redução de custos, sugerindo alternativas de migração e efectuando a avaliação automática das intervenções de preservação. Permite ser extensível através da utilização de novos serviços de conversão e avaliação, e fornece serviços que vão desde a publicação e venda de serviços de conversão/migração até benchmarking de conversores/migradores. Em suma, o CRiB oferece um grande conjunto de serviços de preservação que podem ser utilizados por qualquer instituição, aplicação ou utilizador individual cliente, com o fim de manter as suas colecções de objectos digitais em codificações 677 REINO UNIDO. National Archives – PRONOM: The technical registry. 136 interpretáveis e actuais garantindo que o risco de perda das características representacionais importantes é mínimo. Presentemente: Desafios e Oportunidades Terminado o financiamento do POAP, o projecto foi adaptado para se tornar um verdadeiro projecto open source, do qual fazemos parte no âmbito do Conselho de Disseminação Formação, no sentido de oferecer aos utilizadores uma solução fácil de instalar e de testar (máquina virtual), listas de discussão e documentação de suporte, modalidades de apoio gratuito ou pago. Para os desenvolvedores, fornece orientações sobre o desenvolvimento e tradução, construção fácil, disponibilidade no GitHub, listas de discussão de apoio, muita documentação e um sítio web da comunidade.678 Actualmente o RODA apresenta-se em conformidade com o OAIS e a TRAC e com normas abertas (EAD, PREMIS, METS, NISO Z39.87, etc,). Este repositório permite a preservação a longo prazo da legibilidade e acessibilidade de forma independente de qualquer software ou hardware específico, garantindo a Fidedignidade e autenticidade dos registos digitais na migração através de gerações sucessivas de tecnologias de informação. A sua arquitectura é escalável, na medida em que o sistema de plug-in e agendamento permite acrescentar e alterar funcionalidades ao sistema. Tal permite acomodar uma crescente ingestão de informação, incorporar e preservar informação digital específica, nomeadamente áudio e vídeo digital (cujos formatos de preservação definidos foram WAV679 e MPEG2680, respectivamente), informação herdada de sistemas obsoletos, bases de dados de grande porte, e com flexibilidade para gerir diversos formatos de ficheiros e acomodar a complexidade de registos criados por várias aplicações e para lidar com a evolução contínua da tecnologia. Outras características incluem a capacidade de assegurar que os utilizadores podem aceder à informação digital que estão autorizados a ver e que a informação de acesso restrito só se encontra disponível para os utilizadores com direitos e privilégios de acesso adequados, a capacidade de se integrar com sistemas externos, e a de permitir a ingestão de informação digital de quatro formas diferentes: em linha, fora de linha, por FTP e integração com software de gestão documental de terceiros.681 Os actuais problemas aos quais a equipa e a comunidade do RODA estão sensíveis, prendemse com as questões de escalabilidade, derivada da quantidade de informação que cresce exponencialmente; da monitorização do mundo, no sentido de sistematizar e automatizar a aquisição de informação para detectar obsolescência; da sistematização do planeamento, ligada à responsabilização e a provar no futuro que foram tomadas as melhores decisões possíveis; da automatização dos processos, tendo em conta o número, heterogeneidade e complexidade dos objectos tornam todas as tarefas morosas e o suporte reduzido682. 678 RODA Community. EUA. Library of Congress - WAVE Audio File Format. 680 EUA. Library of Congress - MPEG-2 Encoding Family. 681 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade, p. 7-8. 682 FARIA, Luís - Desafios práticos à preservação digital: RODA e SCAPE. 679 137 O Projecto SCAPE Com vista a encontrar soluções para estas questões, o RODA foi integrado no projecto SCAPE, projecto europeu do 7º programa-quadro, que começou em 2011 e termina em 2014. No âmbito deste projecto pretende-se, no que se refere ao RODA, desenvolver infrastrutura e ferramentas escaláveis, criar uma framework para workflows de preservação e integrar com um sistema de planeamento e monitorização.683 Tal permitirá que no futuro sejam possíveis processos de Ingestão por colecções, permitindo assim a optimização de tarefas para executar numa plataforma escalável, a integração com ferramentas de planeamento de preservação em que a Ingestão accionará o planeamento e levará à execução automática do plano de preservação; também permitirá a monitorização contínua, em que a Ingestão será uma fonte de informação do Macroprocesso de Vigilância684, e monitorizar os eventos que podem desencadear mudanças no planeamento.685 O SCAPE Preservation Environment O SCAPE definiu uma arquitectura para a gestão de armazenamento e de gestão de dados, e o planeamento, monitorização e operações (ou acções) de preservação, chamada SCAPE Preservation Environment (SPE). Esta arquitectura permite a preservação da informação digital a longo prazo através da monitorização contínua de elementos internos e externos que influem na preservação e definir as melhores acções a tomar para a preservação dos objectos digitais custodiados.686 ambiente envolvente e utilizadores acesso, colheita, ingestão monitorização da envolvente e utilizadores Vigilância monitorização de conteúdo e eventos monitorização de acções criar ou reavaliar planos Planeamento Operacionalização Repositório executar plano de acção implementar plano Figura 9 - Ciclo de Vida da Preservação Digital (SCAPE) Nesta lógica, e baseando-se num ciclo de vida da preservação apresentado na figura 9, o repositório (o RODA), relaciona-se com o ambiente envolvente e os seus utilizadores através das funcionalidades de acesso, colheita [harvest], e ingestão de informação. Neste âmbito verificam-se dois tipos de monitorização que vão alimentar o Macroprocesso de Vigilância, e que são a monitorização da envolvente e utilizadores e a monitorização de conteúdo e eventos no repositório. Este dados recolhidos pelo Macroprocesso de Vigilância permitem criar ou 683 FARIA, Luís - Desafios práticos à preservação digital: RODA e SCAPE. Macroprocesso de Vigilância - Watch no original. 685 FARIA, Luis - Ingest with RODA : the present and the future of repository ingest. 686 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 2. 684 138 reavaliar os planos existentes no Macroprocesso de Planeamento687, planos esses que são implementados no Macroprocesso de Operacionalização688, que executará o plano de acção. No meio destes três macroprocessos influem as Políticas. Com base neste ciclo de vida, o SCAPE Preservation Environment apresenta um conjunto de serviços para a monitorização do conteúdo, nomeadamente a ferramenta de software C3PO (Clever, Crafty, Content Profiling of Objects), que usa metainformação extraída a partir de ficheiros de um acervo digital, agregando-os e analisando-os para gerar perfis de conteúdo689, ou seja, uma visão agregada das características de conteúdo, necessário para apoiar o Macroprocesso de Vigilância. Além disso, a ferramenta analisa o conteúdo e permite a selecção de conteúdos (datasets) representativos, que são necessários para o Macroprocesso de Planeamento.690 No âmbito do Macroprocesso de Vigilância apresenta o SCOUT, um sistema de observação de preservação digital que fornece uma base de conhecimento ontológica para centralizar todas as informações necessárias para detectar riscos e oportunidades de preservação691 e notifica sempre que algum evento significativo no mundo lhe puder trazer danos ou oportunidades. As fontes de informação do SCOUT incluem os registos de Formatos e catálogos de software, repositórios digitais e arquivos web, objectivos e políticas organizacionais, experiências, simulações e o conhecimento humano adquirido.692 Ao ser notificado sobre os riscos e oportunidades, o responsável pelo planeamento da preservação define um plano de preservação para os resolver, e envia-o para o repositório para ser executado. O progresso da execução do plano é monitorizado pelo SCOUT.693 Para o Macroprocesso de Planeamento, é utilizado o PLATO 4, uma ferramenta para o planeamento de preservação de forma sistemática. Ele permite a definição de objectivos de preservação, critérios e restrições necessárias para a tomada de decisão e ajuda na avaliação de todas as alternativas de acção, alcançando a melhor solução bem definida, documentando todo o raciocínio por trás das decisões, e proporcionando a rastreabilidade, uma das bases para manter a autenticidade de recursos digitais694 que permite produzir os planos de preservação fidedignos.695 O PLATO define os requisitos de planeamento com base na informação do Macroprocesso de Vigilância, nos perfis de conteúdo, políticas, riscos e oportunidades, informação da envolvente, e avalia alternativas, baseando-se nos dados acerca de acções alternativas e amostras representativas de conteúdo. Após esta fase, faz a avaliação 687 Macroprocesso de Planeamento – Planning no original. Macroprocesso de Operacionalização – Operations no original. 689 KULMUKHAMETOV, Artur; PETROV, Petar - C3PO Clever, Crafty Content Profiling of Objects; PETROV, Petar; BECKER, Christoph - Large-scale content profiling for preservation analysis. 690 FARIA, Luis - Supporting the preservation lifecycle in repositories. 691 FARIA, Luis - Supporting the preservation lifecycle in repositories. 692 FARIA, Luis [et al.] - Automatic preservation watch using information extraction on the Web : a case study on semantic extraction of natural language for digital preservation. 693 KRAXNER, Michael [et al.] - The SCAPE planning and watch suite: supporting the preservation lifecycle in repositories. 694 FARIA, Luis - Supporting the preservation lifecycle in repositories. 695 KRAXNER, Michael [et al.] - The SCAPE planning and watch suite: supporting the preservation lifecycle in repositories. 688 139 dos resultados e produz o plano de preservação.696 O plano de preservação documenta todas as evidências que levam à adopção da estratégia escolhida para preservar o conteúdo, incluindo um fluxo de trabalho que pode ser executado pelo repositório numa plataforma escolhida.697 O resultado do planeamento de preservação é um plano de acção que, além de documentar o processo em si, define as acções necessárias a executar no conteúdo. Caso as acções a executar nos conteúdos levantem preocupações de viabilidade devido ao volume de conteúdo ou a intensidade de acção de computação, será necessário ter em consideração as plataformas escaláveis. A plataforma SCAPE698 fornece orientações sobre como implementar essa plataforma para apoiar a execução de acções de preservação em larga escala.699 No que respeita ao Macroprocesso de Operacionalização, responsável pela alteração dos conteúdos do repositório de acordo com os planos de preservação resultantes da actividade do Macroprocesso de Planeamento700, ele é suportado por um sistema de gestão de workflow bastante utilizado na área científica da biologia, o Taverna. Este sistema permite a execução de workflows complexos que reúnem componentes de preservação, como é o caso das ferramentas de descrição/caracterização, migração e garantia de qualidade. A pesquisa feita no âmbito do SCAPE permitiu verificar como executar workflows complexos em larga escala701, sendo que a escolha como implementação de referência recaiu no Taverna por ser mais fácil de reproduzir do que os sistemas complexos necessários para execução em larga escala.702 A figura seguinte esquematiza como funcionam os componentes entre si. Scout monitorização de conteúdo, eventos e acções Criar ou reavaliar planos Plato Implementar plano RODA executar plano de acção Taverna Figura 10 - Implementação de referência do SCAPE Preservation Environment 696 BECKER, Christoph; KULOVITS, Hannes; RAUBER, Andreas - Trustworthy preservation planning with Plato. 697 FARIA, Luis - Supporting the preservation lifecycle in repositories. 698 SCHMIDT, Rainer - An architectural overview of the SCAPE preservation platform. 699 FARIA, Luis - Supporting the preservation lifecycle in repositories. 700 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 2. 701 SCHMIDT, Rainer - An architectural overview of the SCAPE preservation platform. 702 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 5. 140 Para além destes componentes funcionais, o SCAPE produziu um conjunto de documentos, que considera parte do SCAPE Preservation Environment, nomeadamente as Políticas, sejam estas passíveis de ser compreendidas por humanos ou políticas de controlo para as máquinas, e que servem de suporte às actividades automatizadas de monitorização; orientações para Boas Práticas no âmbito da migração de repositórios de longo prazo em larga escala, da preservação de dados de investigação científica e da preservação ao nível do bit, e que são relevantes no contexto da ISO 16363:2012, do Data Seal of Approval e do NESTOR; Relatórios SCAPE que abordam aprofundadamente cada um dos componentes funcionais do SCAPE Preservation Environment, e que podem ajudar as organizações no processo de implementação do sistema.703 703 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 5. 141 7 - Comparação e aplicação de Documentos Certificação O Quadro Comparativo O quadro comparativo, que se apresenta no fim deste trabalho e que se encontra dividido em três anexos, inspirou-se conceptualmente no esboço de mapeamento de comparação entre o TRAC, o NESTOR, DRAMBORA, ISO27001 e as orientações da OCDE para a segurança dos sistemas de informação elaborado por Katia Thomaz.704 No entanto, tendo em conta o aviso no âmbito do projecto SHAMAN, de que tal trabalho continha algumas imprecisões705, e ainda o facto de tal avaliação não incluir a ISO 16363:2012 e última versão do NESTOR, o quadro comparativo foi elaborado de raíz. Assim sendo, esta comparação é uma proposta, sujeita a crítica e aperfeiçoamentos posteriores, mas que pretende trazer economias, e um trabalho de auditoria mais eficiente, e talvez partir para um documento com recomendações e requisitos para auditoria e certificação de repositórios digitais que integre os melhores aspectos dos documentos alvo de comparação. Comparação dos requisitos/ critérios TRAC, ISO, NESTOR O TRAC é uma lista de requisitos para auditoria, orientada para a auditoria interna e externa. Pode ser usado para o estabelecimento de metas, planeamento, construção de políticas, e avaliação. Foca-se nos repositórios de preservação. A ISO 16363:2012, ao contrário do TRAC, permite às organizações obterem uma certificação de confiança dos seus repositórios a nível internacional. Com o estabelecimento desta nova norma, os arquivos passam a ter objectivos mensuráveis para alcançar a confiança dos seus repositórios e os utilizadores possuem uma forma para determinar se um arquivo em particular corresponde às suas necessidades. O NESTOR é um catálogo com referências e notas, desenvolvido a partir de uma perspectiva e prioridades e motivos específicos derivados do contexto alemão em termos de restrições legais, o funcionamento das instituições públicas (em termos de recursos financeiros e humanos), as decisões organizacionais a nível nacional. Pode ser usado para o planeamento, construção/montagem e avaliação. O NESTOR 1 e 2 são semelhantes em termos de cobertura e nível de detalhe. Não fornecem detalhes de implementação. Com base em Hofstede, podese supor que a maior necessidade de controlo de incerteza e redução de ambiguidade por parte da Alemanha706, a estatuição de regras como fonte de autoridade impessoal707 e a uniformização de procedimentos como mecanismo de coordenação das actividades da 704 Katia Thomaz A draft TRAC-DRAMBORA mapping RLG/NARA TRAC with NESTOR CCTDR, DCC/DPE DRAMBORA, ISO27001 and OECD guidelines. 705 INNOCENTI, Perla [et al.] - SHAMAN requirements analysis report (public version) and specification of the SHAMAN assessment framework and protocol, p. 61, nota de rodapé 19. 706 HOFSTEDE, Geert – Culturas e organizações, p. 139. 707 HOFSTEDE, Geert – Culturas e organizações, p. 173-174. 143 organização708 será a explicação para a necessidade da Alemanha produzir um documento diferente dos produzidos internacionalmente. Um elemento a ressalvar é a existência do requisito de gestão de qualidade, ao nível do Enquadramento Organizacional, nas duas versões do NESTOR (ponto 5), que não aparece explicitado nos outros documentos. Curiosamente, a primeira versão deste documento incluía neste ponto o requisito de que o repositório teria que reagir a alterações substanciais, que no entanto passa para o ponto 4 (como 4.5), que se refere adequação organizacional ao repositório digital. Outra diferença entre as versões do NESTOR é a explicitação dos aspectos que integram o âmbito da Gestão de Objectos, na primeira versão709 (integridade, autenticidade, disponibilização, confidencialidade e metainformação destes elementos). A sustentabilidade destes aspectos, em conjunto com a rastreabilidade e capacidade de referenciação dos objectos e ainda a facilidade de interpretação a longo prazo, requer um acompanhamento para além do que é normalmente entendido por segurança de TI. O TRAC, a ISO 16363:2012 e o NESTOR Comparativamente ao TRAC, a ISO 16363:2012 apresenta, em alguns aspectos, uma maior granularidade, fazendo com que alguns requisitos TRAC tenham dado origem a mais critérios. A nível de topo apresentam ambos a mesma subdivisão em 3 secções, e dentro das duas primeiras secções, as subsecções são também idênticas. Tal só não acontece na última secção, porque a ISO 16363:2012 integra agora o conceito de gestão de risco (5 Infrastructure And Security Risk Management) e reúne numa só subsecção (5.1 Technical Infrastructure Risk Management) os critérios que o TRAC apresentava em duas subsecções (C1. System Infrastructure e C.2 Appropriate technologies). O TDR/ISO 16363:2012 sugere 109 indicadores enquanto o TRAC fornece apenas 84. Esta discrepância reflecte sobretudo um maior foco, por parte do TDR/ISO 16363:2012, em consolidar os termos adoptados, ao nível da preservação digital, de modo a corresponder aos critérios de uma norma ISO. Assim sendo, alguns indicadores foram englobados dentro de outros ou expandidos (ex.: o indicador TRAC A. 2 é expandido no TDR/ISO 16363:2012 em mais dois indicadores: 3.1.2.1 e 3.1.2.2.); suprimidos (ex.: o indicador TRAC A 4.2) e acrescentados (ex.. o TDR/ISO 16363:2012 acrescenta o indicador 4.3.4) O NESTOR, por sua vez apresenta a mesma divisão em três secções, mas não utiliza subsecções. Considerámos, para efeitos de análise e de comparação, que os critérios resumem o conjunto de requisitos que agrupam, excepto os critérios 8 e 14 que, não tendo nível inferior, correspondem eles próprio a um requisito. Assim, a título de exemplo, consideramos que o critério 1 resume ou engloba os requisitos 1.1 e 1.2. Desta forma, quando se abordar os critérios, estaremos igualmente a abordar os requisitos que dele fazem parte. Daí que no caso da comparação e da avaliação ela tenha sido feita acima de tudo tendo em conta os requisitos. 708 709 HOFSTEDE, Geert – Culturas e organizações, p. 168, 178 e seg. DOBRATZ, Susanne [et al.] – NESTOR catalogue of criteria for trusted digital repositories, p. 15. 144 Comparação entre critérios/métricas TRAC e ISO 16363:2012 Na nossa perspectiva, dos 85 requisitos do TRAC, somente 7 não são claramente transportados para a ISO 16363. Comparativamente, a ISO 16363:2012 não transporta do TRAC requisitos específicos sobre a existência de políticas e procedimentos de solicitação e utilização do feedback de produtores e utilizadores (critério A3.5), sobre a revisão e ajustamento anuais do plano de negócio (critério A4.2), sobre a preservação de quaisquer identificadores únicos associados aos objectos digitais antes da ingestão (critério B2.6), sobre a aplicação de estratégias de preservação documentadas (critério B4.1), sobre a implementação de políticas de acesso documentadas que incluem o registo de todas as acções de acesso que se enquadram nos requisitos do repositório e dos produtores/responsáveis pelo depósito da informação, e que devem ser coerentes com os acordos de depósito estabelecidos para os objectos armazenados (critérios B6.2 e B6.4). No que se refere a estes três últimos requisitos, que dizem respeito à aplicação e implementação, a ISO 16363:2012 apenas solicita a existência do plano de estratégia documental preservação digital e a existência de estratégias documentadas (critérios 3.1.2 e 4.3.1) e o cumprimento das políticas de acesso, que, em conjunto com os procedimentos, devem permitir a disseminação de objectos digitais rastreáveis aos originais com provas da sua autenticidade (4.6.1 e 4.6.2), requerendo apenas o registo de falhas e anomalias no acesso e erros nos dados ou respostas aos utilizadores (4.6.1.1 e 4.6.2.1). Por seu lado, a ISO 16363:2012 apresenta requisitos que não são explicitados no TRAC. Dois desses referentes ao governo e viabilidade organizacional (subsecção 3.1), prendem-se com a existência de um documento de Plano de Estratégia de Preservação que estipule uma abordagem a longo prazo para o desenvolvimento da sua missão (critério 3.1.2) e um documento de política que especifica o tipo de informação que a entidade detentora do repositório pretende preservar, manter, gerir e fornecer ao acesso (3.1.3). Curiosamente, o primeiro critério abordado contém subcritérios que já constam no TRAC, mesmo que só em parte, como é o caso do requisito relativo à monitorização e colmatação das falhas de financiamento (A4.5), que consideramos estar incluído no requisito referente à monitorização do ambiente organizacional para verificar a necessidade de executar planos de sucessão, de contingência e / ou acordos de garantia (3.1.2.2). Ainda na secção da infrastrutura organizacional, a norma ISO 16363:2012 requer, no que se refere à responsabilidade e responsabilização procedimental e enquadramento da política de preservação (subsecção 3.3), a existência de políticas de preservação que estejam em consonâncias com o cumprimento do Plano de Estratégia de Preservação (3.3.2). O maior número de requisitos originais da ISO 16363:2012 surge na secção de Gestão de Objectos Digitais (secção 4), muito por virtude da existência de muitos subrequisitos. Assim, quanto à aquisição de conteúdo no âmbito da Ingestão (subsecção 4.1), é requerido que o repositório tenha procedimentos para identificar e registar as características (propriedades) da informação, em conjunto com a informação de conteúdo (ou conteúdo da informação) a preservar (4.1.1.1 e 4.1.1.2) e especificações para reconhecer e analisar os SIPs (4.1.3). 145 Para efeitos de criação dos AIPs no âmbito da ingestão (subsecção 4.2) a ISO 16363:2012 requer adicionalmente que o repositório tenha uma definição adequada para a análise e preservação a longo prazo dos AIPs (4.2.1) e ainda a documentação do processo de eliminação final dos SIPs (4.2.3), se bem que este último depende de um subrequisito (critério 4.2.3.1) que tem equivalência num requisito mais abrangente do TRAC (critério B2.4). Acerca dos identificadores únicos dos AIPs, é requerido pela ISO 16363, no que respeita a regras para a sua geração, a existência de documentação sobre os processos ligados à alteração, e listagem e verificação de duplicação desses identificadores (critérios 4.2.4.1.3 e 4.2.4.1.4), e adequação do sistema de identificadores às necessidades presentes e futuras (critério 4.2.4.1.5). Ainda sobre os identificadores únicos, o serviço de ligação/resolução deve permitir encontrar o objecto digital independentemente da sua localização física (4.2.4.2). Quanto aos recursos para garantir a qualidade da autoridade da informação de representação dos objectos digitais, surgem dúvidas quanto à equivalência entre o requisito do TRAC sobre o registo da Informação de Representação ingerida (incluindo formatos) (critério B2.8) e o seu desdobramento nos requisitos da ISO 16363:2012, quanto a ferramentas ou métodos para identificar o tipo de ficheiro de todos os objectos de dados ingeridos e definir qual a informação de Representação necessária para tornar os objectos de dados compreensíveis para a Comunidade Designada (critérios 4.2.5.1 e 4.2.5.2). Ainda no âmbito da qualidade da autoridade da Informação de Representação, a ISO 16363:2012 requer a garantia de acesso à informação de representação necessária e de que ela está persistentemente associada aos objectos de dados relevantes (critérios 4.2.5.3 e 4.2.5.4). No que respeita ao planeamento de preservação (secção 4.3), a ISO 16363:2012 solicita mecanismos para criação, identificação e angariação de Informação Representação adicional em situações de alterações de planos de preservação derivado de monitorização (4.3.3.1). A preservação dos AIPs (subsecção 4.4) fornece algumas dúvidas quanto à equivalência entre o requisito referente às especificações de como os AIPs devem ser armazenados até ao nível dos bits (4.4.1), e o requisito de implementação de estratégias de armazenamento e migração dos AIPs (B4.2), embora o requisito da ISO 16363:2012 se justifique pela necessidade de garantir que a informação contida nos AIPs possa ser extraída a longo prazo. O registo de acções e procedimentos administrativos relevantes para o armazenamento e preservação dos AIPs requer, segundo a ISO 16363:2012 a existência de procedimentos (documentados) para todas as acções tomadas sobre os AIPs, e demonstração de que tais acções estão de acordo com as especificações definidas para essas acções (4.4.2.1 e 4.4.2.2). No âmbito da gestão de acesso (subsecção 4.6), existem dúvidas entre a equivalência do critério referente à necessidade de conformidade com as políticas de acesso (4.6.1) com o critério referente à necessidade de documentar e comunicar à(s) sua(s) comunidade(s) designadas que opções de acesso e de entrega existem (B6.1), apesar não restarem dúvidas quanto à equivalência com o requisito que diz respeito à necessidade do sistema de gestão de acesso implementar totalmente a política de acesso (B6.5). Para a gestão de risco a nível de infrastruturas e segurança (secção 5), a ISO 16363:2012 obriga à identificação e documentação dos processos críticos que afectam a capacidade de cumprir com as suas responsabilidades obrigatórias no âmbito da gestão dos riscos das operações e objectivos de preservação associados à infra-estrutura do sistema do repositório (5.1.1.6), mas apresenta-nos dúvidas quanto à equivalência total, entre os requisitos da ISO 16363:2012 relativos a procedimentos, compromisso e financiamento para substituir hardware e software 146 quando a avaliação indica a necessidade de o fazer (5.1.1.1.4 e 5.1.1.1.8) com os requisitos do TRAC referentes à existência de tecnologias de hardware e software adequados aos serviços que presta às suas comunidades designadas e de procedimentos para receber notificações e monitorizar e avaliar quando são necessárias mudanças de tecnologia de hardware (C2.1 e C2.2), porque a ISO 16363:2012 solicita adicionalmente compromissos e financiamento para pôr em prática a substituição, enquanto o TRAC somente aborda a verificação e avaliação da sua necessidade (ou não.). Na nossa perspectiva, dos 109 requisitos da ISO 16363, somente 18 não são identificados claramente no TRAC. Comparação entre critérios/métricas TRAC e NESTOR Comparando o TRAC com o NESTOR, não encontrámos correspondência directa de 44 requisitos do TRAC no NESTOR. A título de exemplo, e no que se refere à estrutura da organização e recursos humanos (subsecção A2), o TRAC requer a existência de programas de desenvolvimento profissional que fornece aos funcionários as habilitações e competências necessárias (A2.3), enquanto o NESTOR só indica a necessidade de recursos humanos com qualificações necessárias (4.2). No âmbito da responsabilidade e responsabilização procedimental e enquadramento da política de preservação (subsecção A3), o TRAC especifica a necessidade da existência de procedimentos e políticas em vigor, e os mecanismos para a sua revisão e actualização, em que se incluem políticas escritas que especificam os direitos legais necessários para preservar os conteúdos digitais ao longo do tempo e que comprovem a aquisição desses direitos, para garantir a solicitação e utilização do feedback de produtores e utilizadores (critérios A3.2, A3.3 e A3.5). Ainda nesta linha o TRAC prevê a existência de um histórico que relate todas as alterações ao funcionamento e tecnologia do repositório, referindo as implicações dessas alterações na preservação do conteúdo digital, e um compromisso com a transparência, responsabilidade e responsabilização, que se verifica em termos de definição, recolha e apresentação de análises à integridade da informação, em sede de programas de auto-avaliação e certificação periódica (critérios A3.6, A3.7, A3.8, A3.9). O NESTOR por comparação, somente requer a definição das finalidades do repositório, o cumprimento da legislação e regras contratualizados e procedimentos ligados à gestão de qualidade (critérios integrados nos grupos 1, 3, 4 e 5 do NESTOR). Na mesma secção, a questão da sustentabilidade financeira (A4), são requerido planos de negócios analisados e ajustados periodicamente, numa perspectiva de transparência e conformidade com normas e práticas de accountability e auditoria, o que inclui análise de riscos, benefícios, investimentos e despesas, para monitorizar e colmatar falhas de financiamento (critérios A4.2, A4.4, A4.5). O NESTOR requer apenas financiamento assegurado (4.1). No âmbito dos contratos, licenças e passivos (A5), o TRAC requer que os contratos especifiquem, documentem e transfiram todos os direitos de preservação necessários, caso contrário terá que definir políticas que abordem possíveis questões e perdas ligadas a conteúdo cujos direitos não estejam clarificados (A5.2, A5.5). Em contraposição, o NESTOR somente requer a existência de contratos entre o repositório digital e os produtores, devendo o repositório agir de acordo com o contratualizado e com a legislação em termos de tarefas de arquivo e de utilização (3.1 a 3.3). Surgem-nos dúvidas referentes ao facto do requisito do TRAC para conseguir identificar e administrar quaisquer restrições à utilização de conteúdo do repositório (A5.4), tenha equivalência no critério do NESTOR referente à aquisição de metainformação que registe os direitos e condições de utilização (12.6). 147 Em termos de Gestão de Objectos Digitais, todas as subsecções do TRAC têm requisitos que não têm equivalência específica com o NESTOR. Assim, relativamente à aquisição de conteúdo no âmbito da Ingestão (subsecção B1), o TRAC requer especificamente respostas adequadas ao produtor/depositador em pontos predefinidos do processo de ingestão, provas de quando a responsabilidade de preservação do conteúdo dos SIPs é formalmente aceite, tendo para isso que existir registos das acções e processos relevantes para a preservação (B1.6, B1.7 e B1.8). O NESTOR só refere a garantia da integridade e autenticidade e aceitação dos objectos digitais de acordo com critérios definidos (6, 7 e 9). Numa perspectiva mais alargada poderíamos englobar todos os requisitos desta subsecção no requisito do NESTOR relativo ao desenvolvimento de critérios para a selecção dos objectos digitais (1.1). No que se refere à criação de AIPs no âmbito da ingestão (subsecção B2) o TRAC apresenta requisitos de registos que comprovem a aceitação do conteúdo do SIP como integrante em AIPs ou a sua eliminação, devendo preservar a ligação entre os AIPs e os identificadores únicos que os conteúdos dos SIP tenham previamente à ingestão, garantindo a existência de recursos para o acesso à informação de Representação de autoridade adequada e sistemas de registo de formatos (critérios B2.4, B2.6, B2.7). Para tal é necessário verificar a integralidade e exactidão do AIP quando é gerado, registando todos os procedimentos ligados à criação do AIP que possam influenciar a preservação (critérios B2.11 e B2.13). O NESTOR somente requer a garantia de integridade, autenticidade dos objectos digitais, e a definição dos AIPs, do seu processo de criação, de armazenamento, legibilidade, e implementação de estratégias que garantam a sua preservação (6, 7, 10), e a identificação única e permanente dos objectos e as suas relações (12.1). No âmbito do Planeamento da Preservação (secção B3), o TRAC requer mecanismos de monitorização e notificação de obsolescência ou inviabilidade da Informação de Representação (incluindo formatos), e ainda a prova da eficácia do seu plano de preservação. (critério B3.2 e B3.4). O NESTOR somente solicita metainformação técnica e a existência de um plano de preservação (12.5 e 8). No que respeita ao Armazenamento de arquivo e à manutenção dos AIPs (subsecção B4) o TRAC requer a utilização de estratégias de preservação documentadas e o registo de todas acções ligadas ao armazenamento de arquivo que sejam relevantes para a preservação (B4.1 e B4.5). O NESTOR somente requer um plano estratégico para as medidas de preservação (8) e não especifica registos para as acções de armazenamento. Para a gestão da Informação (subsecção B5), o TRAC solicita a definição de requisitos mínimos de metainformação que permitam à Comunidade Designada recuperar e identificar os recursos que pretendam (B5.1), enquanto o NESTOR apenas requer o registo de metainformação adequada (12.2, 12.3, 12.4, 12.5, 12.6). Ainda nesta secção, os requisitos do TRAC para a gestão de Acesso (subsecção B6) abordam a necessidade de documentar e informar a Comunidade Designada acerca das opções de acesso disponíveis, de registo de todas acções de acesso, e da definição e implementação de políticas de acesso consistentes com os contratos de depósito e exigências dos produtores/depositantes e do repositório (B6.1, B6.2, B6.4). Ainda neste âmbito o TRAC requer o registo das falhas de acessos e que os recursos humanos verifiquem episódios de "negação de acesso" incorrectos, comprovativos de que o processo que gera o DIP está completo e correto em relação ao pedido, e que todos os pedidos de acesso resultam numa resposta de aceitação ou rejeição. (B6.6, B6.7, B6.8, B6.9). O NESTOR somente requer a definição de critérios para a utilização dos objectos digitais e o acesso adequado aos objectos digitais por parte da Comunidade Designada (11 e 2). 148 Em termos de tecnologias, infra-estrutura técnica e segurança (secção C) o TRAC requer, em termos de infrastrutura do sistema (subsecção C1), a garantia de funcionamento em sistemas operativos e softwares infrastruturais bem suportados, suporte esse que se estende para o hardware e software que garante controlo de funcionalidade de backups para os serviços e recursos geridos pelo repositório (C1.1 e C1.2). Assim o repositório tem que gerir o número e localização de cópias de todos os objectos digitais, garantindo a sincronização dessas cópias, tem que reportar todos os casos de corrupção ou perda de dados, e as medidas tomadas de correcção/substituição, e definir processos para mudança de suportes de armazenamento e / ou de hardware (C1.3, C1.4, C1.6 e C1.7). O NESTOR apenas requer a adequação da infrastrutura tecnológica às necessidades de gestão dos objectos e de segurança, com o fim de proteger o repositório e objectos digitais (13.1, 13.2 e 14), não abordando questões ligadas ao suporte da infrastrutura, de gestão de cópias, medidas para corrupção ou perda de dados, ou mesmo mudança de tecnologia. Quanto às questões da segurança (subsecção C3), o TRAC requer a definição de funções, responsabilidades e autorizações relacionadas com a gestão de mudança no sistema, e documentação para gestão de risco e planos de recuperação de desastres, que incluam no mínimo, cópias fora do sistema (C3.3 e C3.4). O NESTOR apenas aborda a implementação de requisitos de segurança no âmbito do sistema de segurança e a protecção do repositório e dos objectos digitais (13.2 e 14). Em relação ao NESTOR, alguns critérios parecem estar englobados em todos os requisitos de uma subsecção do TRAC. É o caso da definição de critérios para a selecção de objectos digitais (1.1) que parece incluir todos requisitos da gestão de conteúdo no âmbito da ingestão (B1), da garantia de acesso da Comunidade Designada aos objectos digitais (2.1) e a definição dos DIPs e a garantia da transformação dos AIPs em DIPs (11.1 e 11.2), que integram a generalidade dos requisitos de gestão de acesso (B6), a documentação de todos os seus elementos de acordo com um processo definido (5.2), e os requisitos ligados à implementação dos necessidades de gestão dos objectos por parte da infrastrutura (13.1), ligados à infrastrutura do sistema (C1), a definição dos DIPs e a garantia da transformação dos AIPs em DIPs (11.1 e 11.2). Desta feita, somente a necessidade de um plano estratégico para as medidas de preservação (critério 8) parece não ter equivalência no TRAC, que somente requer estratégias de preservação documentadas (B3.1 e B4.1) e mecanismos de alteração de planos de preservação tendo em contas as acções de monitorização (B3.3). Comparação entre critérios/métricas NESTOR e ISO 16363:2012 A comparação entre a ISO 16363:2012 e o NESTOR permitiu verificar a existência de 50 em 109 requisitos do ISO 16363:2012 que não aparecem claramente no NESTOR. Quanto à infrastrutura organizacional (secção 3), surgem logo dúvidas que concernem a governança e viabilidade organizacional (subsecção 3.1). Tais dúvidas dizem respeito à equivalência entre os requisitos de relativos à existência de um Plano Estratégico de Preservação que defina a abordagem do repositório para desenvolver a sua missão a longo prazo (3.1.2) e o requisito do NESTOR relativo ao planeamento a longo prazo (4.4), mesmo que, na nossa perspectiva, não haja dúvidas quanto à relação com outro requisito do NESTOR de existência de um plano estratégico para a preservação técnica no repositório (8). Outra equivalência que traz dúvidas é a relativa ao requisito referente à existência de uma política de colecção que estipule o tipo de informação que irá preservar, manter, gerir e fornecer acesso (3.1.3), em relação ao 149 requisito do NESTOR referente ao desenvolvimento de critérios de selecção dos objectos digitais. No que se refere à estrutura organizacional e recursos humanos (subsecção 3.2), a ISO 16363:2012 requer a existência de programas de desenvolvimento profissional que forneçam aos funcionários as habilitações e competências necessárias (3.2.1.3), enquanto o NESTOR só indica a necessidade de recursos humanos com qualificações necessárias (4.2). No âmbito da responsabilidade e responsabilização procedimental e enquadramento da política de preservação (subsecção 3.3), a ISO 16363:2012 especifica a necessidade da existência de políticas de preservação, de procedimentos e políticas em vigor, e os mecanismos para a sua revisão e actualização para garantir o cumprimento do plano estratégico de preservação (critérios 3.3.2, 3.3.2.1). Ainda nesta linha a ISO 16363:2012 prevê a existência de um histórico que relate todas as alterações ao funcionamento e tecnologia do repositório, referindo as implicações dessas alterações na preservação do conteúdo digital, e um compromisso com a transparência, responsabilidade e responsabilização, que se verifica em termos de definição, recolha e apresentação de análises à integridade da informação, em sede de programas de auto-avaliação e certificação periódica (critérios 3.3.3, 3.3.4, 3.3.5, 3.36). O NESTOR por comparação, somente requer a definição das finalidades do repositório, o cumprimento da legislação e regras contratualizados e procedimentos ligados à gestão de qualidade e a existência de um plano estratégico para medidas de preservação técnica (critérios integrados nos grupos 1, 3, 4, 5 e 8 do NESTOR). Na mesma secção, a questão da sustentabilidade financeira (subsecção 3.4), são requeridos procedimentos de acordo com uma perspectiva de transparência e conformidade com normas e práticas de accountability e auditoria, o que inclui análise de riscos, benefícios, investimentos e despesas, para monitorizar e colmatar falhas de financiamento (critérios 3.4.2, 3.4.3). O NESTOR requer apenas financiamento assegurado (4.1). No âmbito dos contratos, licenças e passivos (subsecção A5), a ISO 16363:2012 requer que os contratos especifiquem, documentem e transfiram todos os direitos de preservação necessários, caso contrário terá que definir políticas que abordem possíveis questões e perdas ligadas a conteúdo cujos direitos não estejam clarificados (3.5.1.1, 3.5.1.4). Em contraposição, o NESTOR somente requer a existência de contratos entre o repositório digital e os produtores, devendo o repositório agir de acordo com o contratualizado e com a legislação em termos de tarefas de arquivo e de utilização (3.1 a 3.3). Surgem-nos dúvidas referentes ao facto do requisito da ISO 16363:2012 para conseguir identificar e administrar quaisquer restrições à utilização de conteúdo do repositório (3.5.2), tenha equivalência no critério do NESTOR referente à aquisição de metainformação que registe os direitos e condições de utilização (12.6). Em termos de Gestão de Objectos Digitais, todas as subsecções da ISO 16363:2012 têm requisitos que não têm equivalência específica com o NESTOR. Assim, relativamente à aquisição de conteúdo no âmbito da Ingestão (subsecção 4.1), a ISO 16363:2012 requer especificamente procedimentos de identificação das propriedades da informação que irá preservar, por forma a garantir um histórico do conteúdo da informação (informação de conteúdo) e das propriedades de Informação a preservar (4.1.1.1, 4.1.1.2). De igual forma devem existir especificações adequadas para o reconhecimento e análise dos SIPs, e respostas adequadas ao produtor/depositador em pontos predefinidos do processo de ingestão e registros das acções e processos de administração relevantes para a aquisição de conteúdo (4.1.3, 4.1.7, 4.1.8). O NESTOR somente aborda a necessidade de aceitar objectos digitais com 150 base em critérios predefinidos e de identificar as características dos objectos digitais que são significativos para a preservação da informação (9 e 9.2) e ainda de registo de metainformação referente aos objectos digitais (12.2, 12.3, 12.5, 12.6). No que se refere à criação de AIPs no âmbito da ingestão (subsecção 4.2), a ISO 16363:2012 requer uma definição associada de cada AIP preservado, que seja apropriada para analisar o AIP e apto para as necessidades de preservação a longo prazo, devendo o repositório ter que documentar a eliminação final dos SIPs, e procedimentos documentados para situações em que o SIP não é incorporado no AIP ou rejeitado, referindo o que ocasionou tal situação (4.2.1, 4.2.3, 4.2.3.1). Ainda nesta linha é requerido um sistema de identificadores únicos e persistentes, adequado para atender às necessidades actuais e previstas, com documentação que descreva todos os processos utilizados para possíveis alterações a esses identificadores, listas completas de todos esses identificadores e fazer verificações pontuais para duplicações, e um sistema de serviços de ligação / resolução confiável, de forma a encontrar o objecto independentemente da sua localização física (4.2.4.1.3, 4.2.4.1.4, 4.2.4.1.5, 4.2.4.2). De igual modo, são necessários recursos para garantir a existência de Informação de Representação com qualidade de autoridade dos objectos digitais, por forma a determinar a informação de Representação necessária para tornar os dados do objecto compreensíveis por parte da Comunidade Designada, garantir o acesso à informação de representação necessária, e que esta esteja persistentemente associada aos objectos de dados (4.2.5, 4.2.5.2, 4.2.5.3, 4.2.5.4). A ISO 16363:2012 considera necessário ainda para a criação de AIPs no âmbito da ingestão, a verificação da integralidade e exactidão dos AIPs aquando da sua criação, e o histórico das acções e processos administrativos relevantes para a criação dos AIPs. (4.2.8 e 4.2.10). O NESTOR somente requer a garantia de integridade e autenticidade dos objectos digitais, e a definição dos AIPs, do seu processo de criação, de armazenamento, legibilidade, e implementação de estratégias que garantam a sua preservação (6, 7, 10), e a identificação única e permanente dos objectos e as suas relações (12.1). No âmbito do Planeamento da Preservação (secção 4.3), a ISO 16363:2012 requer mecanismos de monitorização e notificação relativos ao seu ambiente de preservação, que alertem para a inadequação da Informação de Representação quando a informação custodiada deixe de ser compreendida por parte da Comunidade Designada, para criar, identificar ou angariar Informação de Representação adicional quando necessário, e ainda prova da eficácia do seu plano de preservação. (critérios 4.3.2, 4.3.2.1, 4.3.3.1 e 4.3.4). O NESTOR somente solicita metainformação técnica e a existência de um plano de preservação (12.5 e 8) e a garantia que a Comunidade Designada consegue interpretar os objectos digitais (2.2). No que respeita a preservação dos AIPs (subsecção 4.4) a ISO 16363:2012 requer a preservação da informação de conteúdo dos AIPs, o registo de todas acções e processos administrativos que sejam relevantes para o armazenamento e preservação dos AIPs, sendo que deve especificar os procedimentos referentes a essas acções, e comprovativos de que tais acções vão ao encontro dessas especificações (4.4.1.1, 4.4.2, 4.4.2.1 e 4.4.2.2). O NESTOR somente requer um plano estratégico para as medidas de preservação (8) e não especifica registos para as acções de armazenamento, excepto alterações feitas nos objectos digitais pelo repositório (12.4). Para a gestão da Informação (subsecção 4.5), a ISO 16363:2012 solicita a definição de requisitos mínimos de metainformação que permitam à Comunidade Designada recuperar e identificar os recursos que pretendam (4.5.1), enquanto o NESTOR apenas requer o registo de 151 metainformação adequada (12.2, 12.3, 12.4, 12.5, 12.6). Ainda nesta secção, os requisitos da ISO 16363:2012 para a gestão de Acesso (subsecção B6) abordam a necessidade do registo das falhas de acessos e verificação de episódios de anomalias, e registar e agir sobre indicações de erros nos dados ou nas respostas aos pedidos dos utilizadores. (4.6.1.1, 4.6.2.1). O NESTOR somente requer a definição de critérios para a utilização dos objectos digitais e o acesso adequado aos objectos digitais por parte da Comunidade Designada (11 e 2). Numa perspectiva mais abrangente, poderíamos englobar o conjunto dos requisitos desta subsecção da ISO 16363:2012 em três requisitos do NESTOR, relativos à garantia de acesso aos objectos digitais por parte da Comunidade Designada, na definição dos DIPs e na garantia da transformação dos AIPs em DIPs (2.1, 11.1, 11.2). Em termos de gestão de riscos de infraestrutura e segurança (secção 5), a ISO 16363:2012 requer, em termos de gestão de risco da infrastrutura técnica (subsecção 5.1), a identificação e gestão dos riscos decorrentes das operações e metas de preservação associadas à infra-estrutura do sistema, suporte para o hardware e software que garanta controlo de funcionalidade de backups para os serviços e recursos geridos pelo repositório (5.1.1, 5.1.1.2). Assim o repositório tem que reportar todos os casos de corrupção ou perda de dados, e as medidas tomadas para a sua correcção/substituição, processos para registrar e agir, com base numa avaliação do riscobenefício, à disponibilidade de novas actualizações de segurança, devendo identificar e documentar os processos críticos que afectam sua capacidade de cumprir com as suas responsabilidades, tem que definir processos para mudança de suportes de armazenamento e / ou de hardware, e gerir o número e localização de cópias de todos os objectos digitais, garantindo a sincronização dessas cópias (5.1.1.3.1, 5.1.1.4, 5.1.1.5, 5.1.1.6, 5.1.2, 5.1.2.1). O NESTOR apenas requer a adequação da infrastrutura tecnológica às necessidades de gestão dos objectos e de segurança, com o fim de proteger o repositório e objectos digitais (13.1, 13.2 e 14), não abordando questões ligadas ao suporte da infrastrutura, de gestão de cópias, medidas para corrupção ou perda de dados, ou mesmo mudança de tecnologia. De uma forma geral poderíamos incluir a globalidade dos requisitos desta subsecção nos requisitos do NESTOR relativos à formalização de todos os seus elementos com base num processo definido e a implementação das exigências da gestão de objectos por parte da infrastrutura tecnológica (5.2 e 13.1). Quanto às questões da gestão de riscos de segurança (subsecção 5.3), a ISO 16363:2012 requer a definição de funções, responsabilidades e autorizações relacionadas com a gestão de mudança no sistema, e documentação para gestão de riscos e planos de recuperação de desastres, que incluam no mínimo, cópias fora do sistema (5.2.3 e 5.2.4). O NESTOR apenas aborda a implementação de requisitos de segurança no âmbito do sistema de segurança e a protecção do repositório e dos objectos digitais (13.2 e 14). Em relação ao NESTOR, alguns critérios parecem estar englobados em todos os requisitos de uma subsecção da ISO 16363. É o caso da definição de critérios para a selecção de objectos digitais (1.1) que parece incluir todos os requisitos da gestão de conteúdo no âmbito da ingestão (4.1 da ISO), da garantia de acesso da Comunidade Designada aos objectos digitais (2.1) e a definição dos DIPs e a garantia da transformação dos AIPs em DIPs (11.1 e 11.2), que integram a generalidade dos requisitos de gestão de acesso (4.6 da ISO), a documentação de todos os seus elementos de acordo com um processo definido (5.2), e os requisitos ligados à implementação das necessidades de gestão dos objectos por parte da infrastrutura (13.1), ligados à infrastrutura do sistema (5.1 da ISO). Por outro lado surgem dúvidas de que o 152 requisito referente ao registo de metainformação estrutural dos objectos digitais (12.3) tenha equivalência directa nos requisitos da ISO 16363, referentes à necessidade de ferramentas e métodos que definam a informação de Representação necessária para garantir a compreensibilidade dos dados dos objectos pela Comunidade Designada, com o devido acesso à informação de Representação necessária, e resultante garantia de que a informação de Representação está associada aos objectos de dados de forma persistente (4.2.5.2, 4.2.5.3, 4.2.5.4) Aplicação ao RODA TRAC No âmbito do TRAC, e tomando em consideração a avaliação de conformidade com os critérios da lista de verificação referida, e na qual participámos no âmbito do projecto RODA, considerase que os critérios da secção A (Infrastrutura Organizacional) não se aplicam directamente ao sistema aplicacional do RODA, mas à organização que é o seu detentor.710 No entanto, tomouse como exemplo a DGLAB, primeira detentora do RODA, e sendo esta organização uma instituição estatal ligada à área do património, e que tem à sua disposição recursos para garantir a salvaguarda do património arquivístico nacional em formato electrónico, consideramos que cumpre estes requisitos. Tal cumprimento é verificável pelas evidências na legislação nacional, como a Lei orgânica da instituição, a Lei de Bases de Património Cultural e legislação sobre a protecção de dados, segurança do Estado, direitos de autor e conexos, acesso e reutilização de documentos da Administração Pública, acesso ao património arquivístico e outros regimes específicos de acesso, acessibilidades para cidadãos com necessidades especiais, comércio electrónico, assinatura electrónica e valor probatório dos documentos electrónicos, declaração de compromisso com a preservação a longo prazo, com a gestão e com o acesso à informação digital, disponível a todas as partes interessadas. A nível normativo incluem-se as normas e recomendações adoptadas, como por exemplo ISO 14721:2003 (OAIS), ISO 17799:2005 (segurança), ISO 20652:2003 (pré-ingestão), ISO 9000 (qualidade), ISO 27001:2013 (segurança). Outros documentos passam pela Declaração de missão, acordos de depósito, contratos com fornecedores de serviços ao repositório e licenças de software. Em termos de documentos de política podemos referir a política de aquisição, política de preservação711, política de acesso, compromisso de transparência, plano de contingência/recuperação de desastres, plano de sucessão e o plano de backups e cópias. De especial relevância são ainda os recursos humanos, com a identificação das competências necessárias para operar o repositório em termos dos compromissos assumidos e a demonstração de que o pessoal detém essas competências, a descrição de funções, definição de papéis e responsabilidades. Neste âmbito inclui-se também a formação. A garantia de recursos financeiros requer planos de negócio a curto e longo prazo sustentados por orçamentos e relatórios financeiros e de auditoria, que incluam exposição a cenários de contingência e desastre. O sistema está também dotado de manuais de procedimentos para 710 711 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade. HENRIQUES, Cecília – RODA: política de preservação digital. 153 actualização do sistema, procedimentos de ingestão712, procedimentos de administração713 que incluem tarefas ligadas à preservação e à metainformação descritiva/pesquisa714, procedimentos de disseminação715, procedimento de avaliação da integridade do repositório e resposta a situações de erro/risco e procedimento de avaliação da inteligibilidade (sendo que este são da responsabilidade da entidade funcional de Planeamento de Preservação – CRIB e agora PLATO). No que respeita a secção B (Gestão de Objectos Digitais) e a secção C (Tecnologias, Infrastrutura Técnica e Segurança) surgem como principais evidências os documentos de exploração e a documentação do sistema. Os documentos de exploração incluem relatórios de auditoria externa e de auto-avaliação, documentação sobre as decisões e/ou acções tomadas, relatórios de ingestão716, de administração717 e disseminação718 (que também estão registados nas rotinas de auditoria do sistema). Do ponto de vista de arquitectura, infrastrutura técnica e segurança, inclui-se a Documentação do sistema, incluindo questões como a caracterização dos AIPs, a conversão de SIPs em AIPs e de AIPs em DIPs, a criação de identificadores únicos e persistentes, a segurança de riscos e de permissões, controlos de acesso, controlo e sincronização de cópias (mesmo que estejam fora do sistema), a documentação dos fornecedores indicadora do ciclo de vida do hardware, e finalmente os inventários de backup, software e hardware. A avaliação feita com base no TRAC considera então que o RODA cumpre todos os requisitos relativos à aquisição de conteúdo, planeamento de preservação, armazenamento de arquivo e preservação/manutenção dos AIPs, e gestão de Informação (subsecções B1, B3, B4, B5). Na subsecção B2, de criação de pacotes de arquivo no âmbito da Ingestão, a avaliação efectuada ao RODA antes do início do Projecto SCAPE considerou que o critério B2.10 não era cumprido porque a rede de informação necessária para documentar o cumprimento do requisito de inteligibilidade do conteúdo da informação e de assegurar o nível contratualizado de inteligibilidade dependia inteiramente da especificidade dos objectos de informação, pelo que necessitava de ser criada e adaptada como parte de um projecto próprio, sendo tal especialmente aplicável a tipos de objecto complexos tais como bases de dados, podendo ser utilizadas ferramentas de análise interna (a não ser que essa informação seja fornecida à priori pela metainformação existente).719 A avaliação actual considera que a actual versão do RODA cumpre este requisito, uma vez que se recorre ao feedback dos utilizadores para verificar se a metainformação descritiva dos conteúdos ingeridos é compreensível, sendo o resultado do processo de validação manual/semântico da metainformação descritiva registado no sistema e ligado à metainformação referente ao SIP, executando-se um processo para teste de cada AIP ingerido e registando o resultado no sistema. Quando se constata que o conteúdo do objecto não consegue ser apresentado de forma compreensível, o SIP é rejeitado e os produtores são 712 CORUJO, Luis – RODA: manual de procedimentos de ingestão. CORUJO, Luis – RODA: manual de procedimentos de administração. 714 CORUJO, Luis – RODA: manual de procedimentos de gestão de planos de classificação. 715 CORUJO, Luis – RODA: manual de procedimentos de disseminação. 716 CORUJO, Luis – RODA: manual de procedimentos de ingestão. 717 CORUJO, Luis – RODA: manual de procedimentos de administração. 718 CORUJO, Luis – RODA: manual de procedimentos de disseminação. 719 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade. 713 154 notificados, ficando os sistemas a aguardar a ingestão de um novo SIP. De igual forma, mas já no que respeita à gestão de Acesso (subsecção B6), a avaliação efectuada ao RODA antes do início do Projecto SCAPE considerou existirem dois critérios que não são cumpridos, referentes ao registo e análise das falhas de acessos e demonstração de resultados de todos os pedidos de acesso (critérios B6.6 e B6.9), uma vez que essa versão do sistema RODA ainda não implementava integralmente essa funcionalidade.720 No entanto, o ecossistema SCAPE desenvolveu funcionalidades que permitem o cumprimento dos requisitos de registo e análise das falhas de acesso e outras anomalias (critério B6.6), através do registo de todas as acções de autenticação, sendo tal registo facilmente inspeccionado pelos administradores do sistema, e também de permitir o registo e resolução de problemas relatados pelos utilizadores acerca de erros de respostas ou nos dados (critério B6.9), através da notificação dos administradores do sistema aquando de certas ocorrências e também pela existência de canais de feedback para os utilizadores reportarem quaisquer problemas nos dados ou no repositório. Em termos de Infrastrutura do sistema (subsecção C1) a avaliação efectuada ao RODA antes do início do Projecto SCAPE considerou que o repositório não tinha as funcionalidades de gestão do número e localização de cópias de todos os objectos digitais, nem os mecanismos para assegurar que as múltiplas cópias dos objectos digitais estão sincronizadas (critérios C1.3 e C1.4), mas que tais tarefas eram desempenhas pela organização fora do sistema, uma vez que guardava as cópias dos objectos digitais e respectiva metainformação. Actualmente estes requisitos são cumpridos directamente pela existência de uma cópia-matriz do objecto digital no sistema, e indirectamente através das cópias feitas pelo sistema de backup, que faz a gestão da sua localização. O critério C1.8, referente ao processo de gestão de mudança documentado, é sobretudo um procedimento predominantemente organizacional, que precisa de ser implementado na respectiva instituição, constituindo evidência os documentos ligados à gestão de mudança, como a política de preservação721, o plano de contingência/recuperação de desastres, o plano de sucessão, o plano de backups e cópias, os planos de negócio sustentados por orçamentos e relatórios financeiros e de auditoria, que incluem a exposição a cenários de contingência e desastre, e ainda os procedimentos para actualização, manuais para ingestão722, e para administração.723 O critério C.1.9, que diz respeito à existência de um processo para testar o efeito de alterações críticas ao sistema, está dependente da actuação de pessoal operador do sistema para se considerarem aspectos específicos de configuração local, apesar das actualizações do sistema passarem por um rigoroso procedimento de testes para assegurar que não afectam o seu funcionamento. Este procedimento é realizado em parte durante o ciclo de lançamento dos componentes de fonte aberta, mas, de acordo com o estipulado pela organização, precisa de ser repetido no local por pessoal operador do sistema para se considerarem aspectos de configuração local. Também o critério C1.10 sobre a existência de um processo para integrar novas actualizações de segurança do software com base numa avaliação de risco/benefício, é cumprido parcialmente, porque tais actualizações são feitas intencionalmente de modo manual, de acordo com os procedimentos para actualização definidos pelo organismo. Estas devem ser primeiro instaladas num sítio de pré720 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade. HENRIQUES, Cecília – RODA: política de preservação digital. 722 CORUJO, Luis – RODA: manual de procedimentos de ingestão. 723 CORUJO, Luis – RODA: manual de procedimentos de administração. 721 155 produção antes de se aplicarem à aplicação principal. Adicionalmente os sistemas operativos actuais já produzem notificações e registam quaisquer acções tomadas para melhorar a segurança através de actualizações. A subsecção referente à Tecnologia adequada (subsecção C2) é cumprida totalmente, na medida em que se constata a existência de hardware e software apropriados para os serviços que fornece, e a tecnologia SCOUT para a vigilância de preservação notifica o utilizador quando ocorrem não-conformidades. O ecossistema SCAPE, através do SCOUT e do PLATO, monitoriza o hardware e software, verificando o consumo de recursos para verificação de necessidades e alternativas existentes para a actualização. Paralelamente, existe um quadro de referência para o desenvolvimento do RODA. Finalmente, os critérios referentes à subsecção C3 (Segurança) são comprovados através da documentação indicada anteriormente para secção A (Infrastrutura Organizacional). ISO 16363:2012 A recentíssima (à data da produção deste trabalho) avaliação de conformidade apresentada no âmbito do projecto SCAPE refere-se apenas à perspectiva tecnológica, pelo que existe um conjunto significativo de critérios cuja verificação não pode ser feita fora do contexto da organização responsável pelo repositório ou da infrastrutura tecnológica onde este assenta, pelo que não foi tida em conta na sua avaliação.724 Para o Projecto SCAPE, tais requisitos precisam de ser abordados pelas entidades que adoptarem o SCAPE Preservation Environment, mas referem-se somente a questões organizacionais, não remetendo para o suporte técnico do ecossistema, muito embora sejam tratados nos recursos referentes às questões de Política e de boas práticas.725 Por ser essencialmente uma avaliação no âmbito do ecossistema de preservação desenvolvido pelo referido projecto europeu, foca-se por um lado, no pacote de software que integra não só o RODA, mas também num ambiente de execução, serviços de planeamento e observação, e por outro, nas políticas de controlo de preservação, orientações para boas práticas e relatórios726, verificando-se que o termo “repositório” utilizado em quase todos os critérios existentes na ISO 16363:2012 (apenas um requisito o não menciona explicitamente, o 4.2.4.1.3) se reporta ao SCAPE Preservation Environment e não à organização responsável pelo repositório digital. No entanto, e tal como na avaliação feita no âmbito do TRAC, tomou-se como exemplo a DGLAB, primeira detentora do RODA, pelo que se pretende aventar algumas diferenças de resultados da avaliação feita no âmbito deste trabalho e da avaliação de conformidade no âmbito do projecto SCAPE, e que serão especificados. Assim a avaliação de conformidade do SCAPE considera que a maioria dos critérios apresentados na secção 3 (Infrastrutura Organizacional) está fora do âmbito da sua análise (todos os critérios referentes às subsecções do Governo e Viabilidade Organizacional (3.1), Estrutura Organizacional e Recursos Humanos (3.2), Sustentabilidade Financeira (3.4), e quatro dos sete requisitos da secção Responsabilidade e Responsabilização727 Procedimental e Quadro de Política de Preservação (3.3)), existindo três totalmente suportados (referentes à 724 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 7. FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 23. 726 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 1, 4, 7, 23. 727 Responsabilidade e Responsabilização – Accountability no original. 725 156 políticas de preservação (3.3.2), transparência e Responsabilidade e Responsabilização de todas as acções (3.3.4) e verificações de integridade (3.3.6)), um parcialmente suportado (ligado ao rastreio e gestão de direitos e restrições de propriedade intelectual (3.5.2)), e cinco não suportados (ligados à gestão dos contratos estabelecidos com os produtores (3.5.1 e dentro deste desde o 3.5.1.1 até ao 3.5.2.2)). Na sua perspectiva, a totalidade dos requisitos que consideram estar fora do âmbito da sua análise referem-se a políticas e procedimentos, que são abordados em documentos da sua autoria728, que podem servir de referência para qualquer organização que pretenda adoptar boas práticas na produção de políticas de preservação.729 Estes documentos descrevem um enquadramento de política de preservação que consiste em três níveis que vão desde a Política de Orientação de alto nível, passando pela definição e descrição de Políticas de Procedimentos de Preservação, até a instruções concretas de suporte ao workflow automatizado definidas nas Políticas de Controlo.730 Referem também que os requisitos não suportados poderiam ser considerados fora do âmbito da sua análise, uma vez que os acordos ou contratos de depósitos são estabelecidos fora do sistema tecnológico, mas uma vez que existem sistemas de repositório que fornecem suporte para admissão de acordos de depósito, optaram por considerá-los não suportados.731 Quanto ao requisito parcialmente suportado (3.5.2), o ecossistema SCAPE inclui uma acção que verifica as permissões referentes a cada AIP em relação às restrições definidas na metainformação descritiva, resultando a emissão de um aviso ao proprietário do repositório quando as permissões não estão correctamente definidas.732 No âmbito da norma ISO 16363:2012, a nossa avaliação considera que todos os critérios referentes à secção 3 (Infrastrutura Organizacional) são cumpridos, uma vez que a organização apresenta a documentação que o comprova. É o caso específico do Plano de Preservação Digital referente ao critério 3.1.2, a Declaração de missão e documentos de política de preservação733 e de política de acesso, como declaração de compromisso com a preservação a longo prazo, com a gestão e com o acesso à informação digital, disponível a todas as partes interessadas e que inclui a declaração global das propriedades do objecto digital/classe de objecto digital a preservar, referentes aos critérios 3.1.3 e 3.3.2. Assim, consideramos que os requisitos que a análise produzida no âmbito do projecto SCAPE considerou como fora do âmbito, parcialmente suportadas (3.5.2) e não suportadas (3.5.1 e dentro deste desde o 3.5.1.1 até ao 3.5.2.2), são inteiramente suportados se tivermos em conta a avaliação do RODA no seio da organização. No que se refere à secção 4 da norma, ligada à gestão dos objectos digitais, o SCAPE considera que o seu ecossistema suporta todos os requisitos com excepção de um requisito que consideraram não suportado e de outro considerado fora do âmbito da análise. O requisito não suportado refere-se à descrição de como os AIPs são construídos a partir dos SIPs (4.2.2), ligado à subsecção da criação do AIP no âmbito da Ingestão (4.2), na medida em que somente 728 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 22. FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 23. 730 BECHHOFER, Sean [et al.] – SCAPE Final version of policy specification model; SIERMAN, Barbara; JONES, Catherine; ELSTRØM, Gry – SCAPE Catalogue of preservation policy elements. 731 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 11 e 22. 732 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 11. 733 HENRIQUES, Cecília – RODA: política de preservação digital. 729 157 fornece tal informação ao nível do código-fonte do RODA, notando que é necessário produzir tal documentação.734 O requisito considerado fora do âmbito diz respeito à existência de procedimentos para todas as acções tomadas sobre os AIPs (4.4.2.1), ligado à subsecção referente à Preservação de AIPs (4.2.4), na medida em que teria a ver com questões de documentos de procedimentos e variam de organismo para organismo.735 Quanto à secção referente à gestão dos objectos digitais, a nossa avaliação considera que o RODA cumpre plenamente com os requisitos no âmbito da aquisição de conteúdo, planeamento de preservação, preservação dos AIPs, e gestão da informação (secções 4.1, 4.3, 4.4 e 4.5). A título de exemplo, são apresentados os documentos referentes aos esquemas de metainformação, à política de preservação736, os acordos de depósito e documentação acerca do workflow, o plano de preservação e os relatórios de rotina de auditoria, como evidências dos critérios referentes aos procedimentos e registos ligados às Propriedades da Informação e Informação de Conteúdo critérios 4.1.1.1 e 4.1.1.2), documentação técnica acerca dos formatos e acerca dos elementos que constituem o SIP, como o relatório do RODA 737, para o critério referente ao reconhecimento e análise dos SIPs (critério 4.1.3), o Plano de Preservação Digital com a referenciação de utilização de serviços de registo de formatos e de monitorização da evolução tecnológica, para suprir necessidades de Informação de Representação adicional (critério 4.3.3.1), documentação com indicação de todas acções possíveis de executar sobre os AIPs e rotinas de auditoria que demonstrem a execução e os resultados dessas acções (como é o caso do Documento de política de preservação digital738 e do manual de procedimentos de administração739) (critérios 4.4.2.1 e 4.4.2.2). No que se refere à criação do AIP no âmbito da ingestão (subsecção 4.2), evidencia-se a política de preservação740 que garante a recuperação, identificação e gestão dos AIPs a longo prazo (critério 4.2.1), a descrição das convenções para atribuição de identificadores únicos e persistentes, prova da sua aplicação (ex. relatórios automáticos do sistema), compromisso de produção de relatórios que descrevam o processo de implementação de alterações ao sistema de identificadores (quando tal se verifique, documentação que especifique a estratégia usada para fazer o mapeamento entre o ID original (como a metainformação de proveniência) e o atribuído pelo repositório, quando o SIP já traz um identificador único (critérios 4.2.4.1.3, 4.2.4.1.4, 4.2.4.1.5 e 4.2.4.2), os documentos de política de ingestão, o manual de procedimentos de ingestão741 e a documentação técnica do sistema que permita definir a informação de representação necessária para a sua compreensão, acesso e ligação persistente ao objecto ao qual diz respeito (critérios 4.2.5.2, 4.2.5.3, 4.2.5.4). No que respeita ao requisito referente à descrição de como os AIPs são construídos a partir dos SIPs (4.2.2), consideramos que a documentação técnica produzida no âmbito do desenvolvimento inicial do RODA, como a descrição do sistema, inclui questões como a caracterização dos AIPs, a conversão de SIPs em 734 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 14 e 23. FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 18 e 23. 736 HENRIQUES, Cecília – RODA: política de preservação digital. 737 FARIA, Luis, CASTRO, Luis – RODA Repositório de Objectos Digitais Autênticos – relatório final. 738 HENRIQUES, Cecília – RODA: política de preservação digital. 739 CORUJO, Luis – RODA: manual de procedimentos de administração. 740 HENRIQUES, Cecília – RODA: política de preservação digital. 741 CORUJO, Luis – RODA: manual de procedimentos de ingestão. 735 158 AIPs e de AIPs em DIPs, constituindo evidência de conformidade com o referido requisito. Podemos mesmo aventar que o código-fonte constitui ele próprio um documento evidencial de descrição da construção de AIPs a partir dos SIPs. Ainda dentro desta secção, e ao contrário do que se verificou na avaliação efectuada ao RODA antes do início do Projecto SCAPE 742, verifica-se o cumprimento dos requisitos referentes à garantia de compreensão da informação de conteúdo (critérios 4.2.7, 4.2.7.1, 4.2.7.2, 4.2.7.3), uma vez que se recorre ao feedback dos utilizadores para verificar se a metainformação descritiva dos conteúdos ingeridos é compreensível (4.2.7), sendo o resultado do processo de validação manual/semântico da metainformação descritiva registado no sistema e ligado à metainformação referente ao SIP (4.2.7.1), executando-se e registando no sistema o resultado de um processo para teste de cada AIP ingerido (4.2.7.2). Caso se verifique que a Informação de Conteúdo não consegue ser renderizada (isto é, apresentada de forma compreensível), o SIP é rejeitado e os produtores são notificados, ficando os sistema a aguardar a ingestão de um novo SIP (4.2.7.3). De igual forma, mas já no âmbito dos requisitos de gestão de acesso (subsecção 4.6), constata-se que após a avaliação efectuada ao RODA antes do início do Projecto SCAPE743, foram implementadas medidas no sentido do RODA cumprir plenamente com os critérios de registo e análise das falhas de acesso e outras anomalias (critério 4.6.1.1), através do registo de todas as acções de autenticação, sendo tal registo facilmente inspeccionado pelos administradores do sistema, e também permitir o registo e resolução de problemas relatados pelos utilizadores, referente a erros de respostas ou nos dados (critério 4.6.2.1), através da notificação dos administradores do sistema aquando de certas ocorrências e também pela existência de canais de feedback para os utilizadores reportarem quaisquer problemas nos dados ou no repositório. A avaliação do SCAPE no âmbito da ISO 16363:2012 considerou que a maioria dos requisitos integrados na secção 5, referente à gestão de risco a nível de infrastrutura e de segurança, está fora do âmbito da análise, particularmente a totalidade dos quatro requisitos da subsecção de Gestão de Risco de Segurança (5.2). Assim, na subsecção ligada à Gestão de Risco da Infrastrutura Técnica, consideraram a existência de um requisito parcialmente suportado (ligado à gestão de riscos das suas operações e finalidades de preservação ligadas à infrastrutura do sistema (5.1.1), e de novo fora do âmbito de análise (ligados à utilização de hardware adequado para os serviços que fornece (5.1.1.1.1), procedimentos, compromissos e recursos para substituição de hardware e de software (critérios 5.1.1.1.4 e 5.1.1.1.8), registo e produção de relatórios para a administração acerca de todas as ocorrências de corrupção de dados (5.1.1.3.1), processo para integrar novas actualizações de segurança do software com base numa avaliação de risco/benefício (critério 5.1.1.4), definição de processos para substituição de suportes de armazenamento e hardware (5.1.1.5), identificação e documentação de processos críticos que afectam a capacidade de cumprir com as responsabilidades obrigatórias (5.1.1.6), formalização do processo de mudança (5.1.1.6.1), e existência de processos para teste e aferição dos efeitos da mudança (5.1.1.6.2)) sendo os restantes dez requisitos totalmente suportados. 742 743 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade. BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade. 159 O requisito 5.1.1 foi considerado parcialmente suportado pelo facto de alguns dos seus subrequisitos estarem fora do âmbito do análise, por dizerem respeito a questões ligadas com o hardware utilizado, com a organização e financiamento744, como é o caso dos critérios 5.1.1.1.4, 5.1.1.1.8. Quanto ao requisito 5.1.1.3.1 o SCAPE admite que o sistema é capaz de notificar os administradores por correio electrónico, quando ocorrem erros, e o registo de ocorrências é feito numa plataforma que é independente do repositório.745 Quanto ao requisito 5.1.1.4, referem estar relacionado com a existência de procedimentos escritos, embora a generalidade dos sistemas operativos actuais notifique e registe quaisquer acções tomadas para melhorar a segurança através de actualizações.746 Os restantes requisitos da subsecção 5.1 são considerados fora do âmbito da análise por, na opinião do SCAPE, não estarem relacionados com o sistema. Quanto aos requisitos totalmente suportados que se encontram na subsecção 5.1, o SCAPE sublinha o papel do SCOUT, software abordado anteriormente, porque alarga a capacidade de monitorização do repositório de preservação no que respeita às mudanças de tecnologia747, mas também surgem menções ao Plato (5.1.1.1.3, 5.1.1.1.6, 5.1.1.1.7) e ao plano de desenvolvimento do RODA (5.1.1.1.5). No que se refere aos requisitos da subsecção 5.2, o SCAPE considera estarem todos fora do âmbito da análise, mas refere que a implementação da ISO27001:2013748 favorece grandemente a garantia de conformidade com os requisitos ligados à gestão de riscos de segurança, e no caso específico do critério 5.2.3 refere que o ecossistema SCAPE suporta a gestão de permissões, funções, grupos e utilizadores com grande nível de granularidade, pelo que qualquer política de autorizações pode ser facilmente implementada.749 No que diz respeito à secção de gestão de risco a nível de infrastrutura e de segurança (secção 5), a nossa avaliação evidencia a existência, no âmbito da organizão em apreço, de hardware apropriado para os serviços que fornece (5.1.1.1.1), de documentação como planos de investimentos, inventários de software e hardware, documentação de fornecedores, de procedimentos, compromissos e recursos para substituição de hardware e de software (critérios 5.1.1.1.4 e 5.1.1.1.8), documentação que constata as obrigações do repositório e as tarefas necessárias para o seu cumprimento, definindo os procedimentos considerados vitais para o repositório (critério 5.1.1.6). Para além disso constata-se que o sistema envia notificações de ocorrência de erros aos administradores por correio electrónico e o registo de ocorrências é feito numa plataforma que é independente do repositório (5.1.1.3.1). O requisito identificado com a definição de processos para mudança de hardware e suportes de armazenamento (5.1.1.5) integra-se nos procedimentos definidos para a actualização do parque informático da organização. No entanto, é de referir que o RODA não contém especificamente um processo automático para integrar novas actualizações de segurança do software com base numa avaliação de risco/benefício (critério 5.1.1.4), porque tal tarefa é executada intencionalmente, de acordo com os procedimentos para actualização definidos pelo organismo, de modo manual, sendo primeiro instaladas num sítio web de pré-produção 744 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 19. FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 20. 746 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 20. 747 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 23. 748 ISO 27001:2013, Information technology - Security techniques - Information security management systems – Requirements. 749 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 21. 745 160 antes de se aplicarem à aplicação principal. Adicionalmente os sistemas operativos actuais já produzem notificações e registam quaisquer acções tomadas para melhorar a segurança através de actualizações. O requisito referente à identificação e formalização de processos críticos que afectam a capacidade de cumprir com as responsabilidades obrigatórias (5.1.1.6) tem como evidências os documentos de procedimentos de ingestão750, de administração751, de disseminação752, avaliação da integridade do repositório e resposta a situações de erro/risco, e procedimento de avaliação da inteligibilidade, aos quais se acrescentam os relatórios com registos de acções produzidos pelo sistema. O requisito referente ao processo de gestão de mudança documentado que identifica todas as alterações em processos críticos que possam afectar a capacidade do repositório de cumprir com as suas obrigações (critério 5.1.1.6.1) diz respeito a um procedimento predominantemente organizacional que precisa de ser implementado na respectiva instituição, constituindo evidência documentos ligados à gestão de mudança, como a política de preservação753, o plano de contingência/recuperação de desastres, o plano de sucessão, o plano de backups e cópias, os planos de negócio sustentados por orçamentos e relatórios financeiros e de auditoria, que incluem a exposição a cenários de contingência e desastre, e ainda os procedimentos para actualização, manuais para ingestão754, e para administração.755 O cumprimento do requisito relativo à avaliação do efeito de alterações aos processos críticos do repositório (critério 5.1.1.6.2) está dependente da actuação de pessoal operador do sistema para se considerarem aspectos específicos de configuração local, apesar das actualizações do sistema passarem por um rigoroso procedimento de testes para assegurar que não afectam o seu funcionamento, e de tal procedimento ser realizado parcialmente durante o ciclo de lançamento dos componentes de fonte aberta. Finalmente, as funcionalidades que dizem respeito aos requisitos de gestão do número e localização de cópias de todos os objectos digitais e aos mecanismos para assegurar que quaisquer múltiplas cópias dos objectos digitais estão sincronizadas (critérios 5.1.2 e 5.1.2.1), e que não tinham sido implementadas na versão do RODA756 anterior ao projecto SCAPE, são agora cumpridas directamente pela existência de uma cópia-matriz do objecto digital no sistema, e indirectamente através das cópias feitas pelo sistema de backup, que faz a gestão da sua localização. Quanto à gestão de risco de segurança (5.2), o cumprimento dos requisitos é evidenciado pela existência de documentação normativa que passa pelas normas e recomendações adoptadas, como por exemplo ISO 17799:2005 (segurança) e ISO 27001:2013 (segurança). Outra documentação que constitui evidência inclui o plano de contingência/recuperação de desastres, plano de sucessão, plano de backups e cópias, documentação acerca dos recursos humanos, com a identificação das competências necessárias para operar o repositório em termos dos compromissos assumidos e a demonstração que o pessoal detém essas competências, a descrição de funções, definição de papéis e responsabilidades. Finalmente, é digna de menção a documentação referente a 750 CORUJO, Luis – RODA: manual de procedimentos de ingestão. CORUJO, Luis – RODA: manual de procedimentos de administração. 752 CORUJO, Luis – RODA: manual de procedimentos de disseminação. 753 HENRIQUES, Cecília – RODA: política de preservação digital. 754 CORUJO, Luis – RODA: manual de procedimentos de ingestão. 755 CORUJO, Luis – RODA: manual de procedimentos de administração. 756 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade. 751 161 recursos financeiros, como planos de negócio a curto e longo prazo sustentados por orçamentos e relatórios financeiros e de auditoria, que incluam exposição a cenários de contingência e desastre, e manuais de procedimentos para actualização do sistema, procedimento de avaliação da integridade do repositório e resposta a situações de erro/risco, e procedimento de avaliação da inteligibilidade. Resumindo, e de acordo com a avaliação feita no âmbito do projecto SCAPE 757, o RODA suporta totalmente 69 (sessenta e nove) requisitos da ISO 16363:2012, considerando que 31 (trinta e um) requisitos estão fora do âmbito da avaliação por dizerem respeito a questões ligadas à instituição, e que não podem ser cumpridas somente do ponto de vista tecnológico nem verificáveis fora do quadro organizacional. Paralelamente a isto, consideram que 2 (dois) requisitos são parcialmente suportados pelo RODA, que somente não suporta 6 (seis) requisitos, o que dá um nível de conformidade sensivelmente na ordem nos 90 por cento (não contabilizando os requisitos da norma que consideram ser referentes à organização). Tal levou a que o projecto SCAPE identificasse os pontos fracos do RODA a abordar para garantir que este repositório atinga a conformidade total no âmbito de um processo de certificação com base na ISO 16363:2012. Esses elementos são:     Capacidade e gerir e manter os contratos ou acordos de depósito através dos interfaces de utilizador do repositório; Suporte para rastreamento dos direitos de propriedade intelectual; Melhorar a documentação técnica, especialmente a que concerne à conversão de SIPs para AIPs; Capacidade de auxiliar o gestor do repositório na realização de uma melhor gestão de risco.758 NESTOR No âmbito do NESTOR, a avaliação verifica que o RODA cobre a totalidade dos requisitos indicados, muito por causa da documentação produzida em termos de objectivo (critério 1) requisitos mínimos de garantia de acesso (critério 2), compilação de legislação e de compromissos contratuais (critério 3), documentação sobre recurso humanos e financeiros, planeamento a longo prazo e gestão de mudança (critérios 4 e 8), normas, recomendações e manuais de procedimentos (critério 5), procedimentos que garantem a integridade e autenticidade dos objectos digitais (critérios 6 e 7), documentos de política de aquisição (critério 9), política de armazenamento/preservação (critério 10) e política de acessos (critério 11), documentação técnica do sistema, segurança do sistema e esquemas de metainformação (critérios 12, 13, 14). Os relatórios, rotinas de auditoria, documentos de auto-avaliação, registos de aquisições, resultados de monitorização, em suma, os documentos produzidos no âmbito da exploração do sistema, permitem confirmar que o RODA cumpre os requisitos do NESTOR no funcionamento do dia-a-dia. 757 758 FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. IV e 21-24. FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation, p. 23-24. 162 Conclusão à comparação e à aplicação A classificação de um repositório como confiável passa necessariamente pela análise da percepção da sua comunidade de interesse, já que a missão dos repositórios é servir um grupo particular ou a Comunidade Designada, como aponta Yoon (2014).759 Todavia, a autora salienta que a medição dessa percepção é muito complexa, constituindo ainda um campo aberto a estudos futuros, para o qual a generalidade dos projectos de estabelecimento de programas de auditoria e certificação ainda não encontraram critérios claramente definidos. Por outro lado, ainda que seja possível identificar pontos comuns aos vários projectos para a certificação de repositórios digitais confiáveis, ainda não foi possível estabelecer um conjunto de requisitos para um único programa de auditoria e certificação, sob as mesmas regras. Como se verificou, as tentativas de comparação internacional entre os critérios e métodos propostos pelo DCC/DPE, RLG/NARA e NESTOR, em 2007 e em 2011 pelo CCSDS/ISO; Data Seal of Approval Board (DSA); e DIN NESTOR, apenas foi possível estabelecer um consenso quanto a um conjunto de dez princípios básicos para a confiabilidade dos repositórios e os níveis de certificação no âmbito de um European Framework for Audit and Certification of Digital Repositories. Contam-se como constrangimentos os quadros jurídico-legais de cada país, os sistemas institucionais, os estados de desenvolvimento de cada um, entre outros, que levam a que, actualmente, seja ainda difícil desenvolver e aplicar uma norma internacional comum. Com o presente trabalho pretendemos fazer uma brevíssima comparação entre os critérios do TRAC, NESTOR e ISO 16363:2012, destacando os elos de contacto e as diferenças entre eles, embora sem pretensões de assentar “os critérios básicos” para a confiabilidade dos repositórios tal como foi tentado executar em 2007, como atrás referido. Ainda assim, partilha-se algumas ideias quanto à formulação geral de cada documento. Assim, a nosso ver, o TRAC e a ISO 16363:2012 valorizam a necessidade de comprovar documentalmente os mais variados procedimentos – o que se reflecte no apelo à redacção de políticas - de modo a que estejam reunidas as condições para uma auditoria externa imediata, ou seja, que haja mecanismos independentes de verificação, indicando várias vezes que essa deve ser uma das preocupações dos repositórios digitais. Outra finalidade da necessidade de provar documentalmente todos os processos é a protecção legal, na medida em que o repositório demonstra que agiu conforme os procedimentos definidos pelos planos existentes, actuando no cúmulo das suas competências. Já no NESTOR, em contrapartida, embora tenha sido elaborado com vista à auditoria e certificação, raras vezes surge a consciência desse fim. Por outro lado, é visível que o TRAC e a ISO 16363:2012 enfatizam a necessidade de prever situações de erro e de falha a vários níveis, desde as características físicas do objecto ao sistema do repositório, como modo de prevenir e evitar os perigos, garantindo sempre que o repositório constitui uma fonte segura e confiável de depósito e obtenção de informação e que os serviços podem ser assegurados por um longo prazo. Por último, o TRAC e a ISO 16363:2012 são frequentemente mais pormenorizados do que o NESTOR, uma vez que o grau de granularidade é maior. Exemplo disso é a identificação dos 759 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development. 163 requisitos relativos às infrastruturas e à segurança tecnológica, em que o NESTOR trata somente de enumerar as ideias gerais deste âmbito que devem presidir a um repositório, de onde resultam apenas quatro critérios, enquanto que o TRAC e a ISO 16363:2012 fornecem uma explicitação mais detalhada de como devem ser cumpridas essas ideias que, não sendo directamente formuladas, constituem a base de acção (vinte e quatro critérios no caso da ISO 16363:2012). Deve contudo, ser salientado que o TRAC e a ISO 16363:2012, por si só, não são suficientes para assegurar a aplicação prática de programas de auditoria e certificação. É ainda necessário aprofundar questões relacionadas com as práticas desses processos, nomeadamente definir competências e responsabilidades das entidades que neles deverão ser envolvidas, como é o caso dos auditores, estando para esse efeito em produção a ISO 16919, que pretende fixar os requisitos dos membros das futuras equipas a integrarem programas de certificação de repositórios digitais confiáveis. Assim, e apesar de alguns testes feitos à aplicação da ISO 16363:2012, pode considerar-se que o processo de certificação é apenas ainda informal. Deve também ser pensada a forma de articulação destas normas com outras já existentes ligadas à gestão da qualidade, nomeadamente a ISO 9001. Há, portanto, um trabalho a desenvolver nesta área no futuro, pois os processos de auditoria e certificação constituem, apesar das diferentes abordagens e projectos em curso, uma ferramenta de desenvolvimento e aumento da confiança nos repositórios digitais. A certificação passa por análise de questões tanto técnicas como qualitativas, envolvendo aspectos como a responsabilidade das organizações, a sua viabilidade e sustentabilidade em meios humanos e financeiros, a permanente adequação e desenvolvimento tecnológico, a segurança nos acessos e na preservação a longo prazo, o estabelecimento de procedimentos fiáveis para assegurar a manutenção das características e valores intrínsecos aos documentos, bem como a qualidade e adequação dos serviços prestados. Além de encorajar a competição entre instituições, no sentido da constante melhoria, a certificação produz evidência de qualidade para utilizadores e instituições, e induz a maior confiança na capacidade das organizações tomarem medidas para minimizar os riscos inerentes aos sistemas tecnológicos e digitais. 164 8 – Conclusão A pesquisa e este trabalho deram a oportunidade de abordar e apresentar um conjunto de pontos que estão intimamente ligados à informação digital, documentos digitais, objectos digitais e sua preservação, mas também aos repositórios e sua confiabilidade e confiança neles depositada. Aparenta ser progressivamente do conhecimento geral que a informação digital, pela sua dependência de sistemas intermediários (compostos por software e hardware), e características de versatilidade e complexidade, derivadas da sua composição em diversos componentes, e diferentes formas de registo e armazenamento, é ameaçada por problemas que vão desde:  a ausência da percepção social/organizacional de posse ou, pelo contrário, excessivo sentido de individualização;  a perda de informação operacional e de informação-memória e perda de valor evidencial, conduzindo a que a responsabilização de conduta e actividades fiquem comprometidas;  dificuldades de gestão a nível de armazenamento, identificação, recuperação, localização, e controlo;  rápida obsolescência tecnológica, seja nos formatos, no software, ou nos suportes, constatável pela ilegibilidade, impossibilidade de acesso e mesmo desaparecimento físico, incerteza de retrocompatibilidade das aplicações informáticas, concorrência comercial;  a instabilidade dos materiais, condições ambientais de armazenamento, os efeitos de manuseamento e utilização, desastres naturais, falhas de infrastrutura, manutenção inadequada;  avanços tecnológicos que obrigam à rápida substituição de hardware, e que advém da competição entre fabricantes, da diminuição do tamanho e do custo das unidades de armazenamento, do aumento da capacidade de armazenamento, e das tendências em termos de fragilidade, estabilidade, segurança e duração antes da obsolescência. Face a estes problemas apresentam-se soluções, que vão desde a inacção à gestão documental tradicional baseada no papel, mas que não são soluções credíveis, e por outro lado temos um conjunto de respostas credíveis, que se centram na gestão dos documentos electrónicos como documentos principais em ambiente electrónico. A gestão da informação digital requer assim medidas, estratégias consignadas num plano de preservação que responsabilize e implique todos os elementos da organização que promove a sua gestão. Ao contrário da conservação dos documentos em suportes ditos tradicionais ou analógicos, e que tem como objectivo que os documentos permaneçam sem quaisquer alterações, recorrendo ao restauro e à prevenção e recuperação dos suportes deteriorados, a preservação digital pretende garantir o acesso à informação electrónica e a sua autenticidade independentemente do formato, software e hardware usados na sua produção ou utilização 165 para que foi concebida de origem, para que ela possa ser utilizada a longo prazo, sem qualquer constrangimento físico de plataforma, legal, patrimonial, etc. No entanto a preservação digital implica um trabalho de definição das características dos documentos electrónicos e de sistematização a priori à sua produção. Para além das questões intelectuais, organizacionais, sociais, etc. ligadas às necessidades ou intenções que conduziram à sua produção, é necessário definir as suas características significativas a nível técnico, semântico e de eficácia de comunicação, ligadas essencialmente à parte física, parte lógica, e parte conceptual do objecto. Para melhor seleccionar a estratégia de preservação a ser aplicada, é preciso ter em conta os critérios de exequibilidade, a sustentabilidade, a viabilidade e a pertinência, e ainda elementos como a análise de riscos, o registo de formatos e a metainformação. Tudo isto conduz-nos para a definição de um modelo sistémico de preservação digital, tal como indicado por Thomaz.760 Esse modelo, ou as finalidades e objectivos do mesmo, são identificáveis com os repositórios digitais que têm como objectivo e finalidade a preservação e fornecimento de acesso a informação digital a longo prazo, e que se apelidam de Arquivos Digitais. Ou seja, instituições com responsabilidades na manutenção do Património digital761 e que garantem o seu acesso e utilização762, utilizam mecanismos/ferramentas (tecnologia) para efectivar a gestão e armazenamento dos conteúdos digitais.763 Essas ferramentas são usadas pelos produtores, disseminadores e utilizadores dos documentos digitais. Se um Sistema Aberto de Informação de Arquivo (OAIS) (e sem nos esquecermos das considerações de von Bertalanffy764 e Luhmann765, Checkland766 acerca dos sistemas abertos) é conceptualizado como um arquivo que consiste num conjunto de pessoas e sistemas, e que tem como responsabilidade de preservar informação e disponibilizá-la à Comunidade Designada767, esta definição é suficiente aberta para agregar qualquer repositório ou arquivo, independentemente da tecnologia utilizada e do tipo de informação (analógica ou digital) que gere.768 760 THOMAZ, Katia P - Critical factors for digital records preservation. OWEN, John Mackenzie – Preserving the digital heritage: roles and responsibilities for heritage repositories. p. 49. 762 BEAGRIE, Neil et al - Trusted digital repositories: attributes and responsibilities, p. 59. 763 JISC – What is a repository? In Repositories Support Project (RSP); DOBRATZ, Susanne et al. – NESTOR catalogue of criteria for trusted digital repositories, p. 2. 764 BERTALANFFY, Ludwig von – General system theory. 765 LUHMANN, Niklas – Introduction to systems theory. 766 CHECKLAND, Peter; HOLWELL, Sue – Information, systems and information systems. 767 WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information, p. III. 768 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories, p. 4. 761 166 Assim, no caso específico da informação digital, constata-se a existência do binómio mecanismo (tecnologia de informação)  sistema (de informação)769, em que este último é mais abrangente. Dito de outra forma, o repositório digital com funções de Arquivo Digital é um sistema de informação que é constituído por “uma estrutura que compreende tecnologia, recursos humanos e um conjunto de políticas para incorporar, gerir e acessibilizar numa perspectiva, continuada objectos digitais de natureza arquivística770”, sendo isto que a distingue de repositórios digitais com outras finalidades e objectivos. Neste âmbito surge o RODA como arquivo nacional digital, através do qual a entidade coordenadora e auditora da política arquivística nacional, a Direcção-Geral de Arquivo, actual DGLAB pretende ter capacidade para incorporar documentos electrónicos de forma controlada assegurando a sua gestão ao longo do tempo e a sua acessibilização aos utilizadores, dando assim resposta efectiva a necessidades de depósito, gestão e autenticidade de informação electrónica. Sendo desenvolvido pela DGLAB (então Direcção-Geral de Arquivos), com a colaboração informática da Universidade do Minho, este projecto acarretou o desenvolvimento progressivo de funcionalidades básicas e sólidas e ir progressivamente aumentando estas funcionalidades de forma a receber maiores tipologias de objectos digitais e futuramente, dar resposta e apoio directo a organizações que possuam objectos digitais mas não disponham de recursos especializados nesta área. Este repositório digital foi construído tendo como base o OAIS e documentos técnicos produzidos no âmbito do projecto InterPARES. A base do repositório RODA assenta na plataforma FEDORA, utilizando vários esquemas de metainformação como o EAD, PREMIS, METS e NISO Z39.87. O RODA é hoje em dia um projecto open source, dotado de arquitectura escalável e que permite a integração, gestão, preservação e acessibilização de bases de dados relacionais, texto estruturado, imagens fixas, áudio e vídeo digital. Com uma comunidade crescente, principalmente a nível internacional, o RODA é considerado o repositório digital open source mais avançado do mundo, podendo tal ser constatado pela forma como foi integrado e utilizado num projecto europeu do 7º programa-quadro, o SCAPE, e do qual se pretende desenvolver infrastrutura e ferramentas escaláveis, criar uma framework para workflows de preservação e integrar com um sistema de planeamento e monitorização.771 Face ao exposto no magistral Modelo de Referência OAIS, verifica-se uma total identificação entre o RODA e os Modelos conceptualizados nesta norma, a saber, Modelo de Ambiente Externo, Modelo Funcional, e Modelo de Informação. Assim, é fácil de identificar os intervenientes e as entidades funcionais e interfaces relacionadas propostas na norma OAIS com as definidas e desenvolvidas no âmbito no RODA, nomeadamente a entidade funcional de Planeamento de Preservação. Ao mesmo tempo, é analogamente verificável a existência no RODA dos conteúdos e metainformação (descritiva, administrativa, estrutural, técnica, de preservação) que está identificada no Modelo de Informação do OAIS, e que se referem às diversas classes de 769 JISC – What is a repository?. In Repositories Support Project (RSP); FERREIRA, Miguel - Introdução à preservação digital, p-71; VERHEUL, Ingeborg - Networking for digital preservation, p. 21. 770 BARBEDO, Francisco – Arquivos digitais: da origem à maturidade, p. 12. 771 FARIA, Luís - Desafios práticos à preservação digital: RODA e SCAPE. 167 objectos, à taxonomia dos objectos de informação e os Pacotes de Informação (SIP, AIP, DIP) por eles constituídos. E se o espectro de aplicação do Modelo OAIS extravasou o objecto de informação de arquivo772, podemos considerar que tal se deveu ao facto do trabalho desenvolvido em torno deste Modelo de Referência, em termos de Metainformação estrutural773 e de preservação774, de especificação das Interfaces775 e para auditoria e certificação776 têm como fim o desenvolvimento de todo uma estrutura de normalização com o fito de aumentar a confiabilidade e as garantias de confiança nos repositórios digitais. Esta necessidade de afirmar que o repositório digital é de confiança surge como tentativa de fazer o contraponto aos perigos e riscos derivados da especificidade da informação digital. Implica portanto anteceder-se a estes, identificá-los e medi-los, para que não haja desvios dos resultados expectados, e devem estar baseados no âmbito do risco calculado e “aceitável”, como elemento de minimização do perigo.777 A confiança baseia-se em expectativas em relação às intenções ou comportamento de outros, seja ela fornecida pela interacção continuada entre as partes, seja pelo sentimento de segurança derivado das estruturas que sustentam uma instituição, seja ela derivada da informação credível que se constitui pela reputação demonstrável/certificação.778 No caso específico dos repositórios digitais aplicam-se assim três níveis de confiança, referentes à forma como conquistam a confiança das suas comunidades designadas, como confiam nos fornecedores externos, e como os utilizadores confiam na informação fornecida pelo repositório779. Assim, para atingir os seus objectivos, um repositório digital deve corresponder a um conjunto de expectativas que passam pela sua existência no âmbito de um sistema organizacional que viabilize a preservação da informação e o próprio repositório a longo prazo, que aceite a responsabilidade da manutenção dos recursos digitais a longo prazo de acordo com os interesses dos depositantes e dos actuais e futuros utilizadores, que demonstre a responsabilidade e sustentação financeira, que o seu planeamento seja de acordo com as recomendações e normas internacionais referentes à gestão, acesso e segurança a longo prazo dos recurso digitais depositados, que defina metodologias para avaliação da qualidade dos 772 BARBEDO, Francisco - Arquivos digitais: da origem à maturidade, p. 11-12. METS - Metadata Encoding and Transmission Standard. 774 GUENTHER, Rebecca et al. - PREMIS Data Dictionary for Preservation Metadata, v 2.2. 775 ISO 20652:2006, Space data and information transfer systems - Producer-archive interface: methodology abstract standard. 776 AMBACHER, Bruce et al. - Trustworthy repositories audit & certification: criteria and checklist; ISO 16363:2012, Space data and information transfer systems - Audit and certification of trustworthy digital; ISO/PRF 16919, Space data and information transfer systems - Requirements for bodies providing audit and certification of candidate trustworthy digital repositories; DOBRATZ, Susanne [et al.] – NESTOR catalogue of criteria for trusted digital repositories. 777 GIDDENS, Anthony - As consequëncias da modernidade, p. 35-37. 778 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development, p. 22-23; ROUSSEAU, Denise et al. - Not so different after all: across-discipline view of trust, p. 395. 779 BEAGRIE, Neil et al - Trusted digital repositories: attributes and responsibilities, p. 9. 773 168 sistemas de acordo com as expectativas de confiabilidade da comunidade, e que mantenha políticas, práticas e desempenhos auditáveis e aferidas por entidades independentes.780 Tudo isto desemboca num processo de auditoria e certificação, baseadas normas tecnológicas, práticas aceites e mecanismos para autenticação de autoria e precisão do seu conteúdo 781, para a qual deve ser desenvolvidos critérios e/ou requisitos cujo cumprimento seja fonte de confiança. Para estes processos de auditoria, certificação e análise de risco, têm concorrido uma série de documentos, que em geral, enquadram as características expectáveis dos repositórios digitais em : • Conformidade com o Modelo de Referência OAIS; • Responsabilidade administrativa; • Viabilidade Organizacional; • Sustentabilidade financeira; • Adequação tecnológica e procedimental; • Segurança do sistema • Prestação de contas procedimental (ligada à certificação. São assim exemplos, o TRAC e a ISO 16363:2012, o NESTOR; os 10 Princípios, o Data Seal of Approval, o European Framework for Audit and Certification of Digital Repositories, todos estes no âmbito da certificação, o DRAMBORA referente à avaliação de risco, e o PLATTER, como ferramenta para planificação de repositórios digitais de confiança. E se no âmbito da certificação emergem tantos documentos com requisitos para auditoria e certificação, que, malgrado as tentativas de compromisso entre as entidades dos quais emanam, acabam por ser concorrenciais. Daí termos considerado importante aventurarmonos numa comparação entre os documentos que ponderámos serem os mais utilizados, ou mais amplamente anunciados: o TRAC, a ISO 16363:2012 e o NESTOR. Esta comparação permitiu apurar que o TRAC é um trabalho de charneira, que sistematizou as recomendações mais significativas fornecidas pelos estudos académicos produzidos até então, e contem um conjunto de requisitos a serem usados no âmbito de auditorias. A ISO 16363:2012 revela-se um digno sucessor do TRAC, estendendo o número de requisitos, tendo sido desenvolvido por meio de análises técnicas a repositórios, que entretanto verifica ter uma expansão tanto no número, como nas funcionalidades. Este documento foi produzido como norma internacional a ser utilizada para obtenção, por parte das organizações detentoras de repositórios digitais, 780 SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais, p. 71. Cft. BEAGRIE, Neil et al - Trusted digital repositories: attributes and responsibilities, p. 5. 781 PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories, p. 596 e p.603. 169 de certificação de confiança a nível internacional, requerendo a existência de mecanismos independentes de verificação e de prova documental de todos os procedimentos. Por seu lado, o NESTOR é produto das especificidades do contexto alemão, principalmente no âmbito explícito da gestão de qualidade e da segurança TI. Comparativamente, o NESTOR é menos pormenorizado que o TRAC e a ISO 16363:2012, e, na nossa opinião, estes documentos aparentam englobar implicitamente a maioria dos requisitos no documento alemão. Com base nessa opinião, consideramos que seria possível evoluir para uma situação de consenso que desse origem a uma nova norma internacional que integrasse as disposições de ambos, no sentido de superar os constrangimentos derivados da especificidade jurídico-legal de cada país. Foi também nesse sentido que se procedeu à avaliação do RODA, aplicando nesse processo esses documentos, com o fito de verificar se o RODA seria digno de confiança para quem o utiliza de acordo com os fins a que este repositório se propõe cumprir. No entanto, e apesar do que a pesquisa e este trabalho verificaram, é difícil garantir que o cumprimento dos requisitos, acompanhado por processos de auditorias internas e externas tendo como fim a certificação, leve a que, de forma automática, os utilizadores confiem nos repositórios digitais. São conhecidos exemplos de certificação que redundam em procedimentos cristalizados, e que, por vezes, a sua formalização nada tem a ver com as práticas exercidas. E dada a evolução tecnológica, seja em termos de sistema intermediário, seja em termos de formatos e tipologias de informação electrónica, é difícil garantir que o nível de cumprimento dos requisitos se mantenha. Para que tal se verifique, é necessário que haja um investimento constante em Pesquisa, Desenvolvimento e Inovação, na renovação do parque tecnológico e na formação dos recursos humanos que gerem o sistema. Tudo isto implica sustentabilidade financeira e vontade da gestão de topo. E, obviamente, de auditorias internas e externas constantes, e com resultados transparentes. Tudo isto permitirá que a qualidade das práticas e do serviço prestados aos vários utilizadores, clientes, Comunidade Designada (os resultados) iguale, ou mesmo supere, a reputação existente. E assim permitir que o nome do repositório, do organismo responsável e a informação que ele recebe, gere, mantem e fornece possam ser eles próprios considerados sinónimos de confiança. 170 Referências Bibliográficas ADOBE - TIFF developer information site [Em linha]. Adobe Systems Incorporated, 2002 [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://partners.adobe.com/public/developer/tiff> ALLIANCE FOR PERMANENT ACCESS TO THE RECORDS OF SCIENCE NETWORK (APARSEN) Report on peer review of digital repositories [Em linha]. V.1.0. [S.l.]: APARSEN, 2012. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.alliancepermanentaccess.org/wpcontent/uploads/downloads/2012/04/APARSEN-REP-D33_1B-01-1_0.pdf> ALEMANHA. Deutsche Initiative für NetzwerkInformation (DINI) Working Group “Electronic Publishing“ – DINI certificate document and publication services [Em linha]. v.3.0. Göttingen. DINI: Niedersächsische Staats: Universitätsbibliothek Göttingen, 2010. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://edoc.hu-berlin.de/series/dini-schriften/2010-3en/PDF/dini-zertifikat-2010-3-en.pdf > ALLINSON, Julie - OAIS as a reference model for repositories: an evaluation [Em linha]. v 0.5. [S.l.]: UKOLN: JISC, 2006. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.ukoln.ac.uk/repositories/publications/oais-evaluation-200607/Drs-OAISevaluation-0.5.pdf> ALVES, Ivone [et al.] - Dicionário de terminologia arquivística. Lisboa: Instituto da Biblioteca Nacional e do Livro, 1993. ISBN 972-565-146-4 AMBACHER, Bruce [et al.] - An audit checklist for the certification of trusted digital repositories: draft for public comment [Em linha]. Mountain View, Calif.: RLG-NARA Task Force on Digital Repository and Certification; 2005. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://library.oclc.org/cdm/ref/collection/p267701coll33/id/408> AMBACHER, Bruce [et al.] - Trustworthy repositories audit & certification: criteria and checklist [Em linha]. [S.l.]: RLG-NARA Task Force on Digital Repository and Certification: CRL: OCLC, 2007. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf> ANSI/NISO Z39.87: 2006, Data Dictionary - Technical metadata for digital still images. ANSI/NISO ANTÓNIO, Júlio - O sistema de gestão documental: oportunidade do software livre nos municípios portugueses [Em linha]. Lisboa: [s.n.], 2008. Tese para obtenção do grau de Mestrado em Ciências da Documentação e Informação pela Faculdade de Letras da Universidade de Lisboa. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://hdl.handle.net/10451/1739>. ARCHIVAL WORKSHOP PROGRAM COMMITTEE - Archival Workshop on Ingest, Identification, and Certification Standards (AWIICS) draft report [Em linha]. College Park, Md.: NARA, 1999; 171 rev. 20 Abr. 2004. [Consult. 11 Nov. http://nssdc.gsfc.nasa.gov/nost/isoas/awiics/> 2013]. Disponível na Internet: <URL: ARCHIVAL WORKSHOP PROGRAM COMMITTEE - Certification of digital archives and preservation methodology: certification input document. In Archival Workshop on Ingest, Identification, and Certification Standards (AWIICS) draft report [Em linha]. College Park, Md.: NARA, 1999; rev. 20 Abr. 2004. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://nssdc.gsfc.nasa.gov/nost/isoas/awiics/CertifBase.ppt> ARMS, William - Digital libraries [Em linha]. [S.l.]. M.I.T. Press, 2000. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.cs.cornell.edu/wya/diglib/MS1999/index.html>. ISBN 0-262-01180-8 AUSTRÁLIA. National Library of Australia - Preservation metadata for digital collections [Em linha]. [S.l.]: NLA: PANDORA Australia's Web Archive, 1999. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://pandora.nla.gov.au/pan/25498/200206250000/www.nla.gov.au/preserve/pmeta.html> BANAT-BERGER, Françoise [et al.] – L’archivage numérique à long terme. les débuts de la maturité. Paris: Direction des Archives de France; La Documentation française, 2009. ISBN 9782-11-006942-9 BARBEDO, Francisco - Arquivos digitais: da origem à maturidade. Cadernos BAD. [Em linha]. Nº 2 (2005) p. 6 – 18 [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.bad.pt/publicacoes/index.php/cadernos/article/view/810>. ISSN 0007-9421 BARBEDO, Francisco - RODA+: estratégia para a formação de uma comunidade. Lisboa: DGLAB, 2012. Acessível na Direcção-Geral do Livro, dos Arquivos e das Bibliotecas, Lisboa, Portugal. BARBEDO, Francisco; CORUJO, Luis; SANT’ANA, Mário – Recomendações para a produção de planos de preservação digital [Em linha]. V2.1. Lisboa: Direcção-Geral de Arquivos, 2011, [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://arquivos.dglab.gov.pt/wpcontent/uploads/sites/16/2014/02/Recomend_producao_PPD_V2.1.pdf>. BARBEDO Francisco [et al.] – RODA: Repositório de Objectos Digitais Autênticos. In Actas do 9º Congresso Nacional de Bibliotecários, Arquivistas e Documentalistas [Em linha]. Ponta Delgada: APBAD, 2007. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.bad.pt/publicacoes/index.php/congressosbad/article/view/535> BARBEDO, Francisco; GOMES, Eugénia; HENRIQUES, Cecília - Recomendações para a gestão de documentos de arquivo electrónicos – SIADE 1: contexto de suporte [Em linha]. Lisboa: Instituto dos Arquivos Nacionais/Torre do Tombo: Instituto de Informática, 2000, [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://arquivos.dglab.gov.pt/wpcontent/uploads/sites/16/2013/10/siade_caderno1.pdf>. ISBN 972-8107-59-5 BARBEDO, Francisco; MARTINS, Sílvia – Preservação digital. Nação e Defesa. Lisboa: Instituto de Defesa Nacional. ISSN 0870-757X. 5ª série, nº133 (2012) p. 167-177. 172 BARBEDO, Francisco [et al.] – Recomendações para a produção de planos de preservação digital [Em linha]. V1.0. Lisboa: Direcção-Geral de Arquivos, 2008, [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.adporto.pt/ficheiros_a_descarregar/PlanoPreservacaoDigital_v1.0.pdf>. BEAGRIE, Neil; GREENSTEIN, Daniel – A strategic policy for creating and preserving digital collections : a report to the Digital Archiving Working Group. London: British Library Research and Innovation Centre, 1998. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.ukoln.ac.uk/services/elib/papers/supporting/pdf/framework.pdf>. ISBN 0-71239714-0 BEAGRIE, Neil ; JONES, Maggie – Preservation management of digital materials: a handbook [Em linha]. [s.l]: DPC, 2008, [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.dpconline.org/advice/preservationhandbook>. ISBN 978-0712308861 BEAGRIE, Neil, [et al.] - Trusted digital repositories: attributes and responsibilities, an RLGOCLC report [Em linha]. Mountain View, Calif.: RLG, 2002, [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://oclc.org/content/dam/research/activities/trustedrep/repositories.pdf>. BEARMAN, David - Collecting software: a new challenge for archives & museums. Archival Informatics Technical Report [Em linha]. Vol. 1, nº 2 (1987). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.archimuse.com/publishing/bearman_col_soft.html>. ISSN 1042-1459 BECHHOFER, Sean [et al.] – SCAPE Final version of policy specification model [Em linha]. [S.l.:s.n.], 2013. [Consult. 16 Set. 2014]. Disponível na Internet: <URL: http://www.scapeproject.eu/wp-content/uploads/2013/08/SCAPE_D13.1_UNIMAN_V1.0.pdf > BECKER, Christoph - Trustworthy preservation planning [Em linha]. Vienna: [s.n], 2010. Tese para obtenção do grau de Doutor em Ciências Técnicas pela Faculdade de Informática da Universidade Técnica de Viena. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://nbn-resolving.de/urn/resolver.pl?urn=urn:nbn:de:0008-2011061603> BECKER, Christoph; KULOVITS, Hannes; RAUBER, Andreas - Trustworthy preservation planning with Plato. ERCIM news [Em linha]. [S.l.] Nº 80 (2010), p.24-25 [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://ercim-news.ercim.eu/images/stories/EN80/EN80web.pdf>. ISSN 0926-4981 BERGMEYER, Winfried - NESTOR criteria catalogue of criteria for trusted digital repositories [Em linha]. v.2. Frankfurt am Main: Network of Expertise for Long-Term STORage and LongTerm Accessibility of Digital Resources in Germany (NESTOR) Working Group Trusted Repositories - Certification, 2009. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://files.d-nb.de/nestor/materialien/nestor_mat_08_eng.pdf>. BERTALANFFY, Ludwig von – General system theory: foundations, development, applications. New York: George Braziller, 1969. ISBN 978-0-8076-0453-3 173 BLAU, Peter; SCOTT, W Richard - Formal organizations: a comparative approach. Stanford, Calif.: Stanford University Press, 2003. ISBN 978-0-8047-4890-2 BORBINHA, José – Depósito e preservação na Biblioteca Nacional Digital. In 8º Congresso Nacional de Bibliotecários, Arquivistas e Documentalistas – Nas encruzilhadas da informação e da cultura: (re)inventar a profissão: actas [Em linha]. Lisboa: APBAD, 2004. [Consult. 2013-0924] Disponível na Internet : <URL: http://www.bad.pt/publicacoes/index.php/congressosbad/article/view/645/642>. BOWDITCH, James; BUONO, Anthony; STEWART, Marcus - A primer on organizational behavior. 7a ed. New York: John Wiley & Sons, 2007. ISBN 978-0-4700-8695-7 BRADLEY, Kevin – Defining digital sustainability. Library Trends [Em linha]. Vol. 56, nº 1 (2007), p. 148-163. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL:https://www.ideals.illinois.edu/bitstream/handle/2142/3772/Bradley561.pdf?sequence =2>. ISSN 1559-0682 BRADLEY, Kevin; LEI, Junran; BLACKALL, Chris - Towards an open source repository and preservation system [Em linha]. Paris: UNESCO, 2007. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://unesdoc.unesco.org/images/0015/001547/154761e.pdf> BRAND, Stewart - Escaping the digital dark. Library Journal [Em linha]. Vol. 124, Nº2 (1999), p. 46-48. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.rense.com/general38/escap.htm> BULLOCK, Alison - Preservation of digital information: issues and current status. Network Notes [Em linha]. Nº 60 (1999). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://epe.lac-bac.gc.ca/100/202/301/netnotes/netnotes-h/notes60.htm>. ISSN 1201-4338. BUSH, Vannevar - As we may think. The Atlantic Monthly [Em linha]. Jul. (1945). [Consult. 14 Mar. 2013]. Disponível na Internet: <URL: http://www.theatlantic.com/magazine/print/1945/07/as-we-may-think/303881/> CABRAL, Maria Luísa - Amanhã é sempre longe demais: crónicas de preservação & conservação. Lisboa: Gabinete de Estudos A&B, 2002. ISBN 972-98827-1-1 CAFÉ, L. [et al.] - Repositórios institucionais: nova estratégia para publicação científica na rede. In Anais do XXVI Congresso brasileiro de ciências da comunicação [Em linha]. Belo Horizonte: INTERCOM. 2003. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.intercom.org.br/papers/nacionais/2003/www/pdf/2003_ENDOCOM_TRABALHO_ cafe.pdf > CANDELA, Leonardo; CASTELLI, Donatella; PAGANO, Pasquale - History, evolution and impact of digital libraries. In IGLEZAKIS, Ioannis, ed. lit.; SYNODINOU, Tatiana-Eleni, ed. lit.; KAPIDAKIS, Sarantos, ed. lit. - E-Publishing and digital libraries: legal and organizational issues.[Em linha]. Hershey, Pa.: IGI Global, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.researchgate.net/publication/229422428_History_Evolution_and_Impact_of_Digi tal_Libraries/links/09e415110d91b1c40f000000>. ISBN 978-1-60960-031-0 174 CANDELA, Leonardo [et al.] - The digital library reference model. [Em linha]. V1.0. [S.l.]: DL.org, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://bscw.researchinfrastructures.eu/pub/bscw.cgi/d222816/D3.2b%20Digital%20Library%20Reference%20Mod el.pdf> CAPLAN, Priscilla [et al.] - Data dictionary for preservation metadata: final report of the PREMIS Working Group [Em linha]. [S.l.]: OCLC/RLG PREMIS Working Group: LOC, 2005. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.loc.gov/standards/premis/v1/premisdd_1.0_2005_May.pdf> CASE, Donald – Looking for information. 2ª ed. London: Academic Press: Elsevier, 2007. ISBN 978-0-12-369430-0 CASE, Mary – Framing the issue: open access. ARL: a bimonthly report [Em linha]. Nº 226 (Fev. 2003), pp 8-11. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.arl.org/component/content/article/6/1229>. ISSN 1050-6098 CENTER FOR RESEARCH LIBRARIES (CRL) - Ten principles [Em linha]. Chicago: Center for Research Libraries (CRL), (2007?) [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.crl.edu/archiving-preservation/digital-archives/metrics-assessing-andcertifying/core-re>. CHAMPION, Dean - Sociology of organizations. New York: McGraw-Hill, 1975. ISBN 978-0-07010492-1 CHECKLAND, Peter; HOLWELL, Sue – Information, systems and information systems: making sense of the field. Chichester: Wiley, 2005. ISBN 978-0471-95820-8 CHEN, Su-Shing - The paradox of digital preservation. Computer [Em linha]. Vol. 34, nº. 3 (Mar. 2001), p. 2-6. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.fpdigital.com/resources/306-the-paradox-of-digital-preservation>. ISSN 00189162 CHIAVENATO, Idalberto – Teoria geral da administração. 6ª ed. Rio de Janeiro: Ed. Campus, 2006. ISBN 978-85-352-0849-8 CONWAY, Paul - Preservation in the digital world. [Em linha]. [S.l.]: Council on Library and Information Resources, 1996. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/conway2/>. ISBN 1-887334-49-1 CONWAY, Paul - Preservation in the age of google: digitization, digital preservation, and dilemmas. The library quarterly [Em linha] Vol. 80, nº 1 (2010), p.61–79 [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://deepblue.lib.umich.edu/handle/2027.42/85223>. ISSN 0024-2519 CORNELL UNIVERSITY LIBRARY; INTER-UNIVERSITY CONSORTIUM FOR POLITICAL AND SOCIAL RESEARCH (ICPSR); MIT LIBRARIES - Digital preservation management: implementing shortterm strategies for long-term problems (digital preservation management workshops and 175 tutorial) [Em linha]. Cambridge, Ma.: MIT Libraries, 2003, actual. 2014. [Consult. 6 Mar. 2014]. Disponível na Internet: <URL: http://www.dpworkshop.org/> CORUJO, Luis – RODA: manual de procedimentos de disseminação. V. 1.1. [S.l.]: Direcção-Geral de Arquivos, 2009 CORUJO, Luis – RODA: manual de procedimentos de ingestão. V. 1.0. [S.l.]: Direcção-Geral de Arquivos, 2009 CORUJO, Luis – RODA: manual de procedimentos de administração. V. 1.0. [S.l.]: DirecçãoGeral de Arquivos, 2009 CORUJO, Luis – RODA: manual de procedimentos de gestão de planos de classificação. V. 1.0. [S.l.]: Direcção-Geral de Arquivos, 2009 CROW, Raym - The case for institutional repositories: a SPARC position paper [Em linha]. Washington, DC.: Scholarly Publishing & Academic Resources Coalition, 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.sparc.arl.org/sites/default/files/ir_final_release_102.pdf> DALE, Robin [et al.] - Preservation metadata for digital objects : a review of the state of the art : a white paper [Em linha]. [S.l.]: OCLC/RLG Working Group on preservation metadata, 2001. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.oclc.org/content/dam/research/activities/pmwg/presmeta_wp.pdf?urlm=161396 > DALE, Robin; GORE, Emily - Process models and the development of trustworthy digital repositories. Information standards quarterly [Em linha]. Vol. 22, nº 2, (2010): p.14-19. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.niso.org/apps/group_public/download.php/4247/FE_Dale_Gore_Trustworthy_Re positories_isqv22no2.pdf>. ISSN 1041-0031 DATA SEAL OF APPROVAL BOARD – DSA Website [Em linha]. [S.l.]: DSA, [2013?]. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://datasealofapproval.org/> DATA SEAL OF APPROVAL BOARD – DSA guidellines 2014-2015 [Em linha]. v.2. [S.l.]: DSA, 2013. Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://datasealofapproval.org/media/filer_public/2013/09/27/guidelines_2014-2015.pdf> DATA SEAL OF APPROVAL; ESTADOS UNIDOS. CCDSDS Repository Audit and Certification Working Group; ALEMANHA. DIN Working Group "Trustworthy Archives – Certification" – European framework for audit and certification of digital repositories [Em linha]. [S.l.]: DAS: CCSDS: DIN. [2010?]. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.trusteddigitalrepository.eu/> DAY, Michael - CEDARS guide to preservation metadata [Em linha]. Leeds: CEDARS, 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.webarchive.org.uk/wayback/archive/20050410120000/http://www.leeds.ac.uk/c edars/guideto/metadata/guidetometadata.pdf>. 176 DECRETO-LEI nº 290-D/99. D.R. I Série. 176 Suplemento (1999-08-02) 4990 (2-10) DECRETO-LEI nº 62/2003. D.R. I Série. 79 (2003-04-03) 2170-2185 DECRETO-LEI nº 165/2004. D.R. I Série. 157 (2004-07-06) 4072-4073 DECRETO-LEI nº 116-A/2006. D.R. I Série. 115 2º Suplemento (2006-06-16) 4330 (4-8) DECRETO-LEI nº 88/2009. D.R. I Série. 70 (2009-04-9) 2159-2175 DECRETO REGULAMENTAR nº 25/2004. D.R. I Série. 165 (2004-07-15) 4269-4278 DELOS ASSOCIATION - Digital libraries: future directions for a european research programme: DELOS brainstorming report [Em linha]. San Cassiano: DELOS Network of Excelence. 2001. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://delosnoe.isti.cnr.it/activities/researchforum/Brainstorming/1st-ws.html> DINAMARCA. Statsbiblioteket; UNIVERSITY OF GLASGOW. Humanities Advanced Technology and Information Institute (HATII) - Repository planning checklist and guidance (Planning tool for trusted electronic repositories - PLATTER) [Em linha]. [S.l.]: DPE: HATII, 2008. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.digitalpreservationeurope.eu/platter.pdf> DLM Forum - European Commission introduction: the DLM-Forum, MoReq and the European Commission [Em linha]. [S.l.]: DLM-Forum, [2005?]. Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://dlmforum.typepad.com/History_of_DLM_Forum_and_MoReq.pdf> DOBRATZ, Susanne [et al.] – NESTOR catalogue of criteria for trusted digital repositories [Em linha]. v.1. Frankfurt am Main: Network of Expertise for Long-Term STORage and Long-Term Availability of Digital Resources in Germany, 2006. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://files.d-nb.de/nestor/materialien/nestor_mat_08-eng.pdf>. DOBRATZ, Susanne; SCHOGER, Astrid; STRATHMANN, Stefan - The NESTOR catalogue of criteria for trusted digital repository evaluation and certification. JODI: journal of digital information [Em linha]. Vol. 8, nº 2. (2007). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://journals.tdl.org/jodi/index.php/jodi/article/view/199/180>. ISSN 1368-7506 DOBRATZ, Susanne; SCHOGER, Astrid - Trustworthy digital long-term repositories: the NESTOR approach in the context of international developments. Research and advanced technology for digital libraries [Em linha]. Vol. 4675, (2007), p. 210–222. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://link.springer.com/chapter/10.1007%2F978-3-540-74851-9_18>. ISSN 978-3-540-74850-2 DOBRATZ, Susanne; SCHOLZE, Frank. - DINI institutional repository certification and beyond. Library hi tech [Em linha]. Vol 24, nº 4 (2006), p. 583-594. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.emeraldinsight.com/journals.htm?articleid=1583893>. ISSN 0737-8831 DUNN, John - Trust and political agency. In GAMBETTA, Diego, ed. lit. - Trust: making and breaking cooperative relations. [Em linha] Oxford: Basil Blackwell, 1988. [Consult. 24 Nov. 177 2013]. Disponível em WWW: <URL: http://www.nuffield.ox.ac.uk/users/gambetta/Trust_making%20and%20breaking%20cooperat ive%20relations.pdf>. ISBN 0-631-15506-6 DURANTI, Luciana - The long-term preservation of authentic electronic records. In Proceedings of the 27th very large data bases conference [Em linha]. Roma: Morgan Kaufmann. 2001. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.vldb.org/conf/2001/P625.pdf>. ISBN 1-55860-804-4 DURANTI, Luciana, ed. lit.; PRESTON, Randy, ed. lit. - International research on permanent authentic records in electronic systems (InterPARES) 2: experiential, interactive and dynamic records [Em linha]. Padova: Associazione Nazionale Archivistica Italiana, 2008. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.interpares.org/display_file.cfm?doc=ip2_book_complete.pdf>. DUREAU, J.M.; CLEMENS D. W. G. - Princípios para a preservação e conservação de espécies bibliográficas. Lisboa: Biblioteca Nacional, 1992. ISBN 972-565-155-3 Encoded Archival Description [Em linha] [S.l.]: Library of Congress, 2002 [Consult. 11 Nov. 2013]. Disponível na Internet: < http://www.loc.gov/ead> ESTADOS UNIDOS DA AMÉRICA. Consultative Committee for Space Data Systems - Audit and certification of trustworthy digital repositories - magenta book [Em linha]. Washington, DC.: National Aeronautics and Space Administration, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: < http://public.ccsds.org/publications/archive/652x0m1.pdf>. ESTADOS UNIDOS DA AMÉRICA. Consultative Committee for Space Data Systems - Producerarchive interface methodology abstract standard - magenta book [Em linha]. Washington, DC.: National Aeronautics and Space Administration, 2004. [Consult. 11 Nov. 2013]. Disponível na Internet: < http://public.ccsds.org/publications/archive/651x0m1.pdf >. ESTADOS UNIDOS DA AMÉRICA. Consultative Committee for Space Data Systems - Reference model for an open archival information system (OAIS) - blue book [Em linha]. Washington, DC.: National Aeronautics and Space Administration, 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <http://public.ccsds.org/publications/archive/650x0b1s.pdf>. ESTADOS UNIDOS DA AMÉRICA. Consultative Committee for Space Data Systems - Reference model for an open archival information system (OAIS) - magenta book [Em linha]. Washington, DC.: National Aeronautics and Space Administration, 2012. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://public.ccsds.org/publications/archive/650x0m2.pdf> ESTADOS UNIDOS DA AMÉRICA. Consultative Committee for Space Data Systems Requirements for bodies providing audit and certification of candidate trustworthy digital repositories - magenta book [Em linha]. V. 1. Washington, DC.: National Aeronautics and Space Administration, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://public.ccsds.org/publications/archive/652x1m1s.pdf > 178 ESTADOS UNIDOS DA AMÉRICA. Consultative Committee for Space Data Systems Requirements for bodies providing audit and certification of candidate trustworthy digital repositories - magenta book [Em linha]. V. 2. Washington, DC.: National Aeronautics and Space Administration, 2014. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://public.ccsds.org/publications/archive/652x1m2.pdf > ESTADOS UNIDOS DA AMÉRICA. Library of Congress - MPEG-2 encoding family. In Sustainability of digital formats planning for Library of Congress collections [Em linha]. [S.l.]: Library of Congress, 2012, rev. 13 Fev. 2014. [Consult. 11 Mar. 2014. Disponível na Internet: <URL: http://www.digitalpreservation.gov/formats/fdd/fdd000335.shtml> ESTADOS UNIDOS DA AMÉRICA. Library of Congress - WAVE audio file format. In Sustainability of digital formats planning for Library of Congress collections [Em linha]. [S.l.]: Library of Congress, 2012, rev. 17 Out. 2013. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.digitalpreservation.gov/formats/fdd/fdd000001.shtml> FARIA, Luís - Desafios práticos à preservação digital: RODA e SCAPE. In Seminário o ambiente digital aberto : desafios e impactos [Em linha]. Braga: Biblioteca Lúcio Craveiro da Silva, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorium.sdum.uminho.pt/handle/1822/17853> FARIA, Luis - Ingest with RODA : the present and the future of repository ingest. In Digital preservation summit 2011 [Em linha]. Hamburg, Alemanha. ,2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorium.sdum.uminho.pt/handle/1822/17847> FARIA, Luis - Supporting the preservation lifecycle in repositories. In International conference on open repositories [Em linha]. [S.l.], 2013. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://or2013.net/sessions/supporting-preservation-lifecycle-repositories> FARIA, Luis, CASTRO, Luis – RODA Repositório de Objectos Digitais Autênticos: relatório final [em linha ]. Lisboa: Direcção Geral de Arquivos e Universidade do Minho, 2007 [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://arquivos.dglab.gov.pt/wpcontent/uploads/sites/16/2013/10/roda_relatorio.pdf> FARIA, Luis [et al.] - RODA : a service-oriented repository to preserve authentic digital objects. In International conference on open repositories [Em linha]. [S.l.:s.n.], 2009. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://hdl.handle.net/1822/9408> FARIA, Luis [et al.] - Automatic preservation watch using information extraction on the Web: a case study on semantic extraction of natural language for digital preservation. In International conference on preservation of digital objects iPRES 2013 [Em linha]. [S.l.:s.n.], 2013. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorium.sdum.uminho.pt/handle/1822/25214> FARIA, Maria Isabel; PERICÃO, Maria da Graça - Dicionário do livro: da escrita ao livro electrónico. Coimbra: Edições Almedina, 2008. ISBN 978-972-40-3499-7 179 FERREIRA, Carla - Preservação da informação digital : uma perspectiva orientada para as bibliotecas [Em linha]. Coimbra : [s.n], 2011. [Consult. 11 Nov. 2013]. Tese de Mestrado em Informação, Comunicação e Novos Media apresentada à Faculdade de Letras da Universidade de Coimbra. Disponível na Internet: <URL:http://hdl.handle.net/10316/15001> FERREIRA, Miguel – RODA: descrição do sistema. V. 0.5. [S.l.]: Direcção-Geral de Arquivos, 2009 FERREIRA, Miguel - Introdução à preservação digital : conceitos, estratégias e actuais consensos [Em linha]. Guimarães: Escola de Engenharia da Universidade do Minho, 2006. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL:http://hdl.handle.net/1822/5820>. ISBN 972-8692-30-7 FERREIRA, Miguel – Preservação de longa duração de informação digital no contexto de um arquivo histórico. [Em linha]. Guimarães : [s.n.], 2009. Tese de doutoramento em Tecnologias e Sistemas de Informação (Sociedade da Informação) apresentada à Escola de Engenharia da Universidade do Minho. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL:http://repositorium.sdum.uminho.pt/handle/1822/9563>. FERREIRA, Miguel - Certificação de repositórios digitais. In Seminário (r)evolução da informação pública : preservar, certificar e acessibilizar [Em linha]. Lisboa; DGARQ, 2011. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL:http://repositorium.sdum.uminho.pt/handle/1822/19412> FERREIRA, Miguel; BAPTISTA, Ana Alice; RAMALHO, José Carlos - A Foundation for automatic digital preservation. Ariadne [Em linha]. Nº 48 (2006). [Consult. 24 Nov. 2013]. Disponível na Internet: <URL:http://www.ariadne.ac.uk/issue48/ferreira-et-al>. ISSN 1361-3200 FERREIRA, Miguel, BAPTISTA, Ana Alice, RAMALHO, José Carlos - CRIB : a service oriented architecture for digital preservation outsourcing. In Actas XATA: XML: aplicações e tecnologias associadas, Portalegre, 2006. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL:http://repositorium.sdum.uminho.pt/handle/1822/4457>. ISBN 972-99166-2-4 FERREIRA, Miguel, SARAIVA, Ricardo; RODRIGUES, Eloy - Estado da arte em preservação digital: Relatório sobre o estado da arte em preservação digital desenvolvido no âmbito do projeto Repositório Científico de Acesso Aberto de Portugal (RCAAP) [Em linha]. [S.l.]: RCAAP: Universidade do Minho, 2012. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://repositorium.sdum.uminho.pt/handle/1822/17049> FERREIRA, Miguel [et al.] – SCAPE Report on compliance validation. [S.l.:s.n.], 2014. FOX, Edward - The digital libraries initiative: update and discussion. Bulletin of the America Society of Information Science [Em linha]. Vol. 26, Nº 1, (1999). [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.asis.org/Bulletin/Oct-99/fox.html>. ISSN 1550-8366 G8 SCIENCE MINISTERS STATEMENT: news story. In GOV.UK [Em linha] 2013. [Consult. 16 jun. 2013]. Disponível na Internet: <URL:https://www.gov.uk/government/news/g8-scienceministers-statement> 180 GAMBETTA, Diego - Can we trust trust? In GAMBETTA, Diego, ed. lit. - Trust: making and breaking cooperative relations. [Em linha] Oxford: Basil Blackwell, 1988. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.nuffield.ox.ac.uk/users/gambetta/Trust_making%20and%20breaking%20cooperat ive%20relations.pdf>. ISBN 0-631-15506-6 GLADNEY, Henry - Perspectives on trustworthy information. Digital document quarterly. [Em linha]. Vol. 1, nº 1 (2002). [Consult. 24 Nov. 2013]. Disponível na Internet: <URL: http://www.hgladney.com/ddq_1_1.htm>. ISSN 1547-8610 GLADNEY, Henry – Preserving digital information [Em linha]. New York : Springer. 2007. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://link.springer.com/book/10.1007%2F978-3-540-37887-7>. ISBN 978-3-540-37887-7 GLADNEY, Henry - Trustworthy 100-year digital objects: evidence after every witness is dead. Journal ACM transactions on information systems [Em linha]. Vol. 22, nº 3 (2004), p. 406–436. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL:http://dl.acm.org/citation.cfm?doid=1010614.1010617>. ISSN 1046-8188 GIARETTA, David; HARMSEN, Henk; KEITEL, Christian – Memorandum of understanding to create a european framework for audit and certification of digital repositories [Em linha]. [S.l.]: DAS: CCSDS: DIN. 2010. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL: http://www.trusteddigitalrepository.eu/Site/Memorandum%20of%20Understanding.html> GIDDENS, Anthony - As consequëncias da modernidade. São Paulo: UNESP, 1991. ISBN 857139-022-3 GRANGER, Stewart - Digital preservation and deep infrastructure. D-Lib magazine. Vol. 8, nº2 (2002). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL:http://www.dlib.org/dlib/february02/granger/02granger.html>. ISSN 1082-9873 GUENTHER, Rebecca [et al.] - PREMIS data dictionary for preservation metadata [Em linha]. V. 2.0. [S.l.]: PREMIS Editorial Commitee: LOC, 2008. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.loc.gov/standards/premis/v2/premis-2-0.pdf > GUENTHER, Rebecca [et al.] - PREMIS data dictionary for preservation metadata [Em linha]. V. 2.2. [S.l.]: PREMIS Editorial Commitee: LOC, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.loc.gov/standards/premis/v2/premis-2-2.pdf > GUENTHER, Rebecca [et al.] - PREMIS data dictionary for preservation metadata [Em linha]. V. 2.1. [S.l.]: PREMIS Editorial Commitee: LOC, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.loc.gov/standards/premis/v2/premis-2-1.pdf > HALL, Richard; TOLBERT, Pamela - Organizations: structure, processes, and outcomes. 10th ed. Upper Saddle River, N.J.: Pearson, 2009. ISBN 978-0132448406 HARMSEN, Henk [et al.] - Explanatory notes on the NESTOR seal for trustworthy digital archives [Em linha]. Frankfurt am Main, Alemanha: Network of Expertise for Long-Term STORage and Long-Term Availability of Digital Resources in Germany, 2013. [Consult. 11 Nov. 181 2013]. Disponível na Internet: nb.de/nestor/materialien/nestor_mat_17_eng.pdf> <URL: http://files.d- HARVARD UNIVERSITY. Harvard Library - Global Digital Format Registry [Em linha]. Cambridge, MA, EUA: Harvard Library, [2013?]. [Consult. 24 Nov. 2013]. Disponível na Internet: < URL:http://library.harvard.edu/preservation/digital-preservation_gdfr.html> HEDSTROM, Margaret - Digital preservation: a time bomb for digital libraries. Computers and the humanities. [Em linha]. Vol. 31, nº 3 (1997), p. 189-202. [Consult. 6 Mar. 2014] Disponível na Internet: <URL: http://www.uky.edu/~kiernan/DL/hedstrom.html>. ISSN 1572-8412 HEDSTROM, Margaret - Digital preservation: problems and prospects. Digital Library Network (DLnet) [Em linha]. Nº 20 (2001). [Consult. 6 Mar. 2014] Disponível na Internet: <URL: http://www.dl.slis.tsukuba.ac.jp/DLjournal/No_20/1-hedstrom/1-hedstrom.html>. HEERY, Rachel; ANDERSON, Sheila - Digital repositories review [Em linha]. [S.l.]: Joint Information Systems Committee, 2005. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL: http://www.jisc.ac.uk/uploaded_documents/digital-repositories-review-2005.pdf>. HENDLEY, Tony – Comparison of methods and costs of digital preservation: British Library research and inovation report 106 [Em linha]. [S.l.]: British Library Research and Innovation Centre, 1998. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL:http://www.ukoln.ac.uk/services/elib/papers/tavistock/hendley/hendley.html>. ISBN 07123-9713-2 HENRIQUES, Cecília - Preservação digital: uma perspectiva arquivística. In BORBINHA, José L. [et al.] - Manifesto para a preservação digital. [Em linha]. [Lisboa: APBAD, 2002]. [Consult. 24 Nov. 2013]. Disponível na Internet: <URL: http://www.apbad.pt/CadernosBAD/Caderno22002/Borbinha.pdf > HENRIQUES, Cecília [et al.] - Recomendações para a gestão de documentos de arquivo electrónicos: SIADE 2. modelo de requisitos para a gestão de arquivos electrónicos [Em linha]. Lisboa: Instituto dos Arquivos Nacionais/Torre do Tombo: Instituto de Informática, 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://arquivos.dglab.gov.pt/wpcontent/uploads/sites/16/2013/10/siade_caderno2.pdf>. HENRIQUES, Cecília – RODA: política de preservação digital. V. 1.0. [S.l.]: Direcção-Geral de Arquivos, 2009 HESLOP, Helen; DAVIS, Simon; WILSON, Andrew - An approach to the preservation of digital records [Em linha]. Camberra: National Archives of Australia, 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.naa.gov.au/Images/An-approach-GreenPaper_tcm16-47161.pdf>. HOFMAN, Hans - Can bits and bytes be authentic? Preserving the authenticity of digital objects. In IFLA annual Conference, 2002 -- IFLA conference proceedings [Em linha]. Glasgow: IFLA, [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://eprints.erpanet.org/39/01/hofman_glasgow02.pdf>. 182 HOCKX-YU, Helen – Digital preservation in the context of institutional repositories [Em linha]. Program: electronic library and information systems [Em linha]. Vol. 40, nº3 (2006). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://eprints.rclis.org/8189/>. ISSN 0033-0337 HOFSTEDE, Geert – Culturas e organizações. [S.l.]: Edições Sílabo, 2003. ISBN 0-07-707474-2 HOU, Chien-Yi; WOJCIK, Caryn; MARCIANO, Richard - Trusted digital repository design: a policy-driven approach. In Archiving conference: final program and proceedings: 2001 [Em linha]. [S.l.]:Society for Imaging Science and Technology. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://salt.unc.edu/DCAPE/docs/Conferences/archiving_2011.pdf> HURLEY, Bernard [et al.] - The Making of America II testbed project: A digital library service model [Em linha]. Washington, D.C.: Council on Library and Information Resources, 1999. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/reports/pub87/pub87.pdf>. ISBN 1-887334-72-6 INFOPÉDIA. Dicionários Porto Editora [Em linha] [2013?]. Porto Editora. [Consult. 16 jun. 2013]. Disponível na Internet: <URL: http://www.infopedia.pt/> INNOCENTI, Perla [et al.] - Towards a holistic approach to policy interoperability in digital libraries and digital repositories. The international journal of digital curation [Em linha]. Vol. 6, nº 1 (2011), p. 111-124. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.ijdc.net/index.php/ijdc/article/view/167>. 124 ISSN 1746-8256 INNOCENTI, Perla [et al.] - SHAMAN requirements analysis report (public version) and specification of the SHAMAN assessment framework and protocol [Em linha]. [S.l.]: SHAMAN Project, 2009. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL:http://shamanip.eu/sites/default/files/SHAMAN_D1.2_Requirements%20analysis%20report_0.pdf> INTERNATIONAL COUNCIL ON ARCHIVES. Committee on Electronic Records - Guide for managing electronic records from an archival perspective [Em linha]. Paris: ICA, 1997 [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.ica.org/download.php?id=1631>. ISBN 0-9682361-0-3 INTERNATIONAL COUNCIL ON ARCHIVES. Committee on Electronic Records - Documentos de arquivo electrónicos: manual para arquivistas [Em linha]. Paris; Lisboa: International Council on Archives: Instituto dos Arquivos Nacionais/Torre do Tombo, 2005. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://arquivos.dglab.gov.pt/wpcontent/uploads/sites/16/2013/10/ica_estudo16.pdf>. INTERPARES Project. Glossary Task Force - The InterPARES glossary [Em linha]. Vancouver: Interpares, 2001 [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.interpares.org/ip1/ip1_documents.cfm?cat=gtf>. INTERPARES Project - InterPARES 2 terminology database [Em linha]. Vancouver: InterPARES, [2006?]. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.interpares.org/ip2/ip2_terminology_db.cfm>. 183 INTERPARES Project - InterPARES 3 terminology database [Em linha]. Vancouver: InterPARES, [2012?]. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.interpares.org/ip3/ip3_terminology_db.cfm>. IOANNIDIS, Yannis - Digital libraries at a crossroads. International journal on digital libraries [Em linha]. Vol. 5, nº 4 (2005), p. 255-265. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://link.springer.com/article/10.1007%2Fs00799-004-0098-4>. ISSN 1432-1300 ISO 15489-1: 2001, Information and documentation -- Records management: Part 1: General. Geneva. ISO ISO 16363:2012, Space data and information transfer systems: Audit and certification of trustworthy digital. Geneva. ISO ISO/PRF 16919, Space data and information transfer systems - Requirements for bodies providing audit and certification of candidate trustworthy digital repositories. Geneva. ISO ISO 19005-1:2005, Document management – Electronic document file format for long-term preservation – Part 1: Use of PDF 1.4 (PDF/A-1). Geneva. ISO ISO 20652:2006, Space data and information transfer systems - Producer-archive interface: Methodology abstract standard. Geneva. ISO ISO 27001:2013, Information technology - Security techniques - Information security management systems – Requirements. Geneva. ISO HENRIQUES, Marta [et al.] - Bidirectional conversion between XML documents and relational data bases. In International conference on CSCW in design [Em linha]. [S.l.:s.n.], 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorium.sdum.uminho.pt/handle/1822/601> JISC - Repositories Support Project [Em linha]. [S.l.] : JISC, [2006-2013?]. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.rsp.ac.uk/>. KEITEL, Christian - DIN standard 31644 and NESTOR certification. In Cultural heritage on line international conference 2012 [Em linha]. Florence: Fondazione Rinascimento Digitale, 2012. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://93.63.166.138:8080/dspace/handle/2012/99 > KINGSLEY, Danny - Those who don’t look don’t find: disciplinary considerations in repository advocacy [em linha]. [S.l.:s.n.] [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://hdl.handle.net/1885/46229>. KRAXNER, Michael [et al.] - The SCAPE planning and watch suite : supporting the preservation lifecycle in repositories. In International conference on preservation of digital objects iPRES 2013 [Em linha]. [S.l.:s.n.], 2013. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorium.sdum.uminho.pt/handle/1822/25215> 184 KULMUKHAMETOV, Artur; PETROV, Petar - C3PO Clever, Crafty Content Profiling of Objects [Em linha]. [S.l.]: Vienna University of Technology [2012?], rev. 25 Fev. 2014. [Consult. 11 Mar. 2014]. Disponível na Internet: <URL: http://ifs.tuwien.ac.at/imp/c3po> KUNY, Terry - A digital dark ages? Challenges in the preservation of electronic information. In IFLA Council and General Conference, 63 , 1997 - IFLA conference proceedings [Em linha]. [S.l.]: IFLA, [1997?]. [Consult. 6 Mar. 2014]. Disponível na Internet: <URL: http://archive.ifla.org/IV/ifla63/63kuny1.pdf>. LASZLO, Krisztina; MCMILLAN, Timothy, YUHASZ, Jennifer - The InterPARES 3 project: implementing digital records preservation in a contemporary art gallery and ethnographic museum. In Annual conference of the International Documentation Committee of the International Council of Museums [Em linha]. Atenas: CIDOC, 2008. [Consult. 6 Mar. 2014]. Disponível na Internet: <URL: http://www.interpares.org/display_file.cfm?doc=ip3_canada_dissemination_cp_laszlo_etal_cidoc_2008.pdf> LAVOIE, Brain - The Open Archival Information System reference model: introductory guide [Em linha]. Dublin, Ohio: Digital Preservation Coalition: Online Computer Library Center, 2004. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.dpconline.org/index.php?option=com_docman&task=doc_download&gid=347> LAVOIE, Brain [et al.] - Preservation metadata and the OAIS information model: a metadata framework to support the preservation of digital objects [Em linha]. Dublin, Ohio: OCLC/RLG Working Group on preservation metadata, 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.oclc.org/content/dam/research/activities/pmwg/pm_framework.pdf?urlm=16139 1> LAVOIE, Brain; GARTNER, Richard - Preservation metadata [Em linha]. v.1. [S.l.]: Digital Preservation Coalition: Oxford University Library Services: Online Computer Library Center, 2005. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.dpconline.org/docs/reports/dpctw05-01.pdf> LAWRENCE, Gregory W. [et al.] - Risk management of digital information: a file format investigation [Em linha]. Washington, DC.: Council on Library and Information Resources, 2000. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/reports/pub93/pub93.pdf>. ISBN 1-887334-78-5 LEE, Kyong-Ho, [et al.] - The state of the art and practice in digital preservation. Journal of research of the National Institute of Standards and Technology [Em linha]. Vol. 107, nº 1 (2002), p. 93-106. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: https://ia600705.us.archive.org/23/items/jresv107n1p93/jresv107n1p93_A1b.pdf>. ISSN 2165-7254 LUHMANN, Niklas – Introduction to systems theory. Cambridge: Polity Press, 2013. ISBN 978-07456-4572-8 185 LUHMANN, Niklas - Familiarity, confidence, trust: problems and alternatives. In: GAMBETTA, Diego, ed. lit. - Trust: making and breaking cooperative relations. [Em linha] Oxford: Basil Blackwell, 1988. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.nuffield.ox.ac.uk/users/gambetta/Trust_making%20and%20breaking%20cooperat ive%20relations.pdf>. ISBN 0-631-15506-6 LUPOVICI, Catherine; MASANÈS, Julien - Metadata for the long term preservation of electronic publications [Em linha]. The Hague: NEDLIB Consortium, 2000. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.kb.nl/sites/default/files/docs/NEDLIBmetadata.pdf>. ISBN 90-6259-146-9 LUSENET, Yola de - Digital heritage for the future. Cadernos BAD. Lisboa. ISSN 0007-9421. Nº 2 (2002) p.15-27. LYNCH, Clifford - Institutional repositories: essential infrastructure for scholarship in the digital age. ARL: a bimonthly report [Em linha]. Nº 226 (Fev. 2003), p. 1-7. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.arl.org/component/content/article/6/1229>. ISSN 1050-6098 LYNCH, Clifford - Authenticity and integrity in the digital environment: an exploratory analysis of the central role of trust. In Authenticity in a digital environment [Em linha]. Washington, DC.: Council on Library and Information Resources, 2000. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/pub92/pub92.pdf/view>. ISBN 1-88733477-7 MÁRDERO ARELLANO, Miguel - Critérios para a preservação digital da informação científica [Em linha]. Brasília: [s.n.], 2008. Tese submetida ao programa de Pós-Graduação em Ciência da Informação do Departamento de Ciência da Informação e Documentação da Universidade de Brasília como requisito parcial para obtenção do grau de Doutor em Ciência da Informação. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorio.unb.br/handle/10482/1518> MARTINS, Ernesto - O repositório: imagem de marca e objeto de aprendizagem em meio digital. In III Conferência do IPCB sobre o livre acesso ao conhecimento científico – O desafio da publicação em meio científico: como, onde, porquê? – Livro de resumos [Em linha]. Castelo Branco: Instituto Politécnico de Castelo Branco, 2013. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorio.ipcb.pt/handle/10400.11/1766>. ISBN 978-989-8196-28-6 MARTINS, Francisco – Preservação digital: novos desafios na justiça. Revista do Ministério Público [Em linha]. Nº 131 (2012) p. 171-189. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://rmp.smmp.pt/wp-content/uploads/2012/10/8.RMP_N131_FRANCISCOMARTINS.pdf> MARYNIAK, Cathy [et al.] - Definitions of digital preservation [Em linha]. Chicago: ALA, 2007. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.ala.org/ala/mgrps/divs/alcts/resources/preserv/defdigpres0408.pdf>. 186 MCGOVERN, Nancy - A digital decade: where have we been and where are we going in digital preservation? RLG DigiNews [Em linha]. Vol. 11, nº 1 (2007). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://deepblue.lib.umich.edu/handle/2027.42/60441>. ISSN 1093-5371 MCGOVERN, Nancy - Principles and good practice for preserving data: interuniversity Consortium for Political and Social Research working paper [Em linha]. 2009. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.ihsn.org/home/sites/default/files/resources/IHSN-WP003.pdf>. MCHUGH, Andrew [et al.] – Digital repository audit method based on risk assessment: DRAMBORA [Em linha]. [S.l.]: DCC: DPE, 2007. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.repositoryaudit.eu/download>. ISBN 978-1-906242-00-8 MCHUGH, Andrew [et al.] - Bringing self-assessment home: repository profiling and key lines of enquiry within DRAMBORA. The international journal of digital curation. Vol. 3, nº 2 (2008) p. 130-142. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://dx.doi.org/10.2218/ijdc.v3i2.64>. ISSN 1746-8256 MERRIAN-WEBSTER DICTIONARY. In Merriam Webster web site [Em linha]. 2013. [Consult. 16 jun. 2013]. Disponível na Internet: <URL: http://www.merriam-webster.com/> METS - Metadata Encoding and Transmission Standard [Em linha]. [S.l.]: LOC, 2007, actual. 2010?. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.loc.gov/standards/mets/mets-home.html> METS – METS schema [Em linha]. V1.10 [S.l.]: LOC, 2013. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.loc.gov/standards/mets/mets.xsd> MIRANDA, Geraldo – Organização e métodos. 5ª ed. São Paulo: Atlas, 1981 MITCHAM, Jenny; HARMAN, Catherine - ADS and the Data Seal of Approval: case study for the DCC. In DCC online. [Em linha]. [S.l.]: DCC, 2011. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.dcc.ac.uk/resources/case-studies/ads-dsa> NILSSON, Hans [et al.] - Final report of the EESSI expert team [Em linha], [S.l.]: European Electronic Signature Standardization Initiative, 1999. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://cryptome.org/eessi.htm> NP 4041: 2005, Informação e Documentação - Terminologia arquivística. Conceitos básicos. IPQ NP 4438-1:2005, Informação e Documentação - Gestão de documentos de arquivo: parte 1: Princípios Directores. IPQ OWEN, John Mackenzie – Preserving the digital heritage: roles and responsibilities for heritage repositories [Em linha]. In Preserving the digital heritage : principles and policies. The Hague: UNESCO: European Commission on Preservation and Access, 2007. [Consult. 03 Mar. 2014]. Disponível em WWW: <URL: www.ica.org/download.php?id=613>. ISBN 978-90-6984-523-4 187 PAÍSES BAIXOS. Nationaal Archief - Digital preservation testbed white paper: migration: context and current status [Em linha]. The Hague: ICTU, 2001. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.nationaalarchief.nl/sites/default/files/docs/kennisbank/migration_0.pdf> PETROV, Petar; BECKER, Christoph - Large-scale content profiling for preservation analysis. In International Conference on Preservation Of Digital Objects iPRES 2012 [Em linha]. [S.l.:s.n.] 2012. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://ifs.tuwien.ac.at/~petrov/publications/c3po-poster-ipres12.pdf> PINTO, Maria Manuela Gomes de Azevedo – Do «efémero» ao «sistema de informação» : a preservação na era digital. Páginas a&b [Em linha]. Nº 15 (2005), p.53-178. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://hdl.handle.net/10216/13432>. ISSN 0873-5670. PINTO, Maria Manuela Gomes de Azevedo - Gestão da informação e preservação digital: uma perspectiva portuguesa de uma mudança de paradigma. In Nuevas perspectivas para la difusión y organización del conocimiento: actas del IX Congreso Isko-España [Em linha]. [S.l.:s.n.], 2009. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://dialnet.unirioja.es/servlet/articulo?codigo=2923189>. ISBN 978-84-8363-397-7 PINTO, Maria Manuela Gomes de Azevedo - PRESERVMAP: um roteiro da preservação na era digital. Porto: Edições Afrontamento; CETAC.MEDIA, 2009. ISBN 978-972-36-1070-3 PORTUGAL. Biblioteca Nacional – BND: Biblioteca Nacional Digital [Em linha]. Lisboa: Biblioteca Nacional, 2002, [actual. 2014?]. [Consult. 25 Mar. 2014]. Disponível na Internet: <URL: http://bnd.bn.pt> PREMIS – 2013 PREMIS Implementation Fair (PIF) minutes [Em linha]. Lisboa: PREMIS: LOC, 2013. [Consult. 6 Mar. 2014]. Disponível na Internet: <URL: http://www.loc.gov/standards/premis/premis-implementation-fair-minutes-2013.docx> PRIETO, Adolfo - From conceptual to perceptual reality: trust in digital repositories. Library Review [Em linha]. Vol.58, nº 8 (2009), p. 593-606. [Consult. 25 Mar. 2014]. Disponível na Internet: <URL: http://www.emeraldinsight.com/journals.htm?articleid=1810441>. ISSN 00242535 RAMALHO, José Carlos - Repositórios digitais. In Pesquisa de informação e inteligência artificial: 3ª Tertúlia em Inteligência Artificial (TeIA) [Em linha]. Porto: [s.n.], 2007. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://repositorium.sdum.uminho.pt/handle/1822/7382> RAMALHO, José Carlos - RODA : repositório de objectos digitais autênticos. In (R)evolução da informação pública : preservar, certificar e acessibilizar. Lisboa: Direção-Geral de Arquivos, Torre do Tombo, 2011. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://hdl.handle.net/1822/17849> 188 RAMALHO, José Carlos [et al.] - RODA and CRiB a service-oriented digital repository. In International conference on preservation of digital objects iPRES 2008. [S.l.:s.n.], 2008. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://hdl.handle.net/1822/8226> RAUBER, Andreas; ASCHENBRENNER, Andreas - Part of our culture is born digital: on efforts to preserve it for future generations. TRANS - Internet-Zeitschrift für Kulturwissenschaften [Em linha]. Nº 10, (2001). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.ifs.tuwien.ac.at/~aola/publications/trans10>. ISSN 1560-182X RAYMOND, Eric - Bit rot. In The Jargon File [Em linha] Version 4.4.7. Actual. 29 Dez. 2003. [Consult. 6 Jan. 2014]. Disponível na Internet: <URL:http://www.catb.org/jargon/html/B/bitrot.html>. RECKER, Astrid - The preservation of digital objects in german repositories: three case studies. Cologne: NESTOR, 2010. Tese de Mestrado em Biblioteca e Ciências da Informação da Faculdade de Ciências da Informação e Comunicação da Escola Superior Técnica de Colónia [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.langzeitarchivierung.de/Subsites/nestor/SharedDocs/Downloads/edition/03_reck er.pdf> REINO UNIDO. Public Record Office - Management, appraisal and preservation of electronic records: principles [Em linha]. 2nd. ed. Kew: Public Record Office, 1999. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://collections.europarchive.org/tna/20080108103210/http:/www.nationalarchives.gov.uk /documents/principles.pdf>. REINO UNIDO. Public Record Office - Requirements for electronic records management systems: 1: functional requirements [Em linha]. Kew: Public Record Office, 2002. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.nationalarchives.gov.uk/documents/requirementsfinal.pdf> REINO UNIDO. National Archives – PRONOM: the technical registry [Em linha]. Kew: The National Archives. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.nationalarchives.gov.uk/PRONOM/Default.aspx> RDF - Resource Description Framework [Em linha]. [S.l.]: World Wide Web Consortium, 2004, [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.w3.org/RDF/> RODA Community [Em linha]. [S.l.]: KEEP Solutions, 2012. [Consult. 24 Nov. 2013]. Disponível em WWW: <URL: http://www.roda-community.org/> ROSS, Seamus; HUGH, Andrew - The role of evidence in establishing trusting repositories. D-Lib magazine. Vol. 12, nº7/8 (2006). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL:http://www.dlib.org/dlib/july06/ross/07ross.html>. ISSN 1082-9873 ROTHENBERG, Jeff - Avoiding technological quicksand: finding a viable technical foundation for digital preservation: a report to the Council on Library and Information Resources [Em linha] Washington, D.C.: Commission on Preservation and Access: Council on Library and Information 189 Resources, 1999. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/rothenberg/reports/rothenberg/pub77.pdf>. ISBN 1887334-63-7 ROTHENBERG, Jeff - Ensuring the longevity of digital information [Em linha]. Washington D.C.: Commission on Library and Information Resources, 1999. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/archives/ensuring.pdf> ROTHENBERG, Jeff - Preserving authentic digital information. In Authenticity in a digital environment [Em linha]. Washington, D.C.: Council on Library and Information Resources, 2000. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/pub92/pub92.pdf/view>. ISBN 1-887334-77-7 ROUSSEAU, Denise [et al.] - Not so different after all: across-discipline view of trust. Academy of management review [Em linha]. Vol.23, nº 3 (1998), p. 393–404. [Consult. 26 Fev 2014]. Disponível na Internet: <URL:http://portal.psychology.uoguelph.ca/faculty/gill/7140/WEEK_3_Jan.25/Rousseau,%20Si tkin,%20Burt,%20%26%20Camerer_AMR1998.pdf>.ISSN 1930-3807 RUSSEL, Kelly; SERGEANT, Derek - The CEDARS project: implementing a model for distributed digital archives. RLG DigiNews [Em linha], vol. 3, nº 3 (1999). [Consult. 26 Fev. 2014]. Disponível na Internet: <URL:http://webdoc.gwdg.de/edoc/aw/rlgdn/preserv/diginews/diginews3-3.html>. ISSN 1093-5371 RUSSELL, Kelly - Digital preservation and the CEDARS project experience. New review of academic librarianship. [Em linha]. Vol. 6, nº 1 (2000), p. 139-154. [Consult. 26 Fev. 2014]. Disponível na Internet: <URL:http://www.tandfonline.com/doi/pdf/10.1080/13614530009516805>. ISSN 1740-7834 SALO, Dorothea - Inkeeper at the roach motel. Library trends [Em linha]. Vol.57, nº 2 (2008). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://digital.library.wisc.edu/1793/22088>. ISSN 1559-0682 SALTER, Jim - Bitrot and atomic COWs: inside “next-gen” filesystems. In Ars technical [Em linha], 2014. [Consult. 30 Jan. 2014] Disponível na Internet: <URL: http://arstechnica.com/information-technology/2014/01/bitrot-and-atomic-cows-inside-nextgen-filesystems/>. SARAMAGO, Maria de Lurdes – Preservação digital de longo prazo: estado da arte e boas práticas em repositórios digitais. Lisboa: [s.n], 2003. Tese de mestrado em Estudos de Informação e Bibliotecas Digitais apresentada ao Instituto Superior de Ciências do Trabalho e da Empresa. SHANNON, Claude – A mathematical theory of communication. The Bell system technical journal [Em linha]. Vol. 27, nº 3 (1948), p. 379–423; Vol. 27, nº 4 (1948), p. 623–656. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www3.alcatel-lucent.com/bstj/vol27- 190 1948/articles/bstj27-3-379.pdf> 1948/articles/bstj27-4-623.pdf> e <URL: http://www3.alcatel-lucent.com/bstj/vol27- SHANNON, Claude; WEAVER, Warren – The mathematical theory of communication. 1st. ed. Urbana, Il.: University of Illinois Press, 1949. SCHMIDT, Rainer - An architectural overview of the SCAPE preservation platform In International conference on preservation of digital objects iPRES 2012 [Em linha]. 2012. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://ipresconference.org/ipres12/sites/ipres.ischool.utoronto.ca/files/iPres%202012%20Conference%20 Proceedings%20Final.pdf>. ISBN 978-0-9917997-0-1 SCHUMANN, Natascha - Tried and trusted: experiences with certification processes at the GESIS data archive. IASSIST quarterly [Em linha]. Vol. 36, nº 3/4, (Fall - Winter 2012). P. 23-27. [Consult. 6 Mar. 2014]. Disponível na Internet: <URL: http://iassistdata.org/downloads/iqvol36_34_schumann_0.pdf> SIERMAN, Barbara; JONES, Catherine; ELSTRØM, Gry – SCAPE Catalogue of preservation policy elements [Em linha]. [S.l.:s.n.], 2014. [Consult. 16 Set. 2014]. Disponível na Internet: <URL: http://www.scape-project.eu/wp-content/uploads/2014/02/SCAPE_D13.2_KB_V1.0.pdf> SIMMEL, Georg – The philosophy of money [Em linha]. 3rd. ed. New York: Routledge, 2004. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.eddiejackson.net/web_documents/Philosophy%20of%20Money.pdf>. ISBN 0-20348113-5 SUDERMAN, Jim - Principle-based concepts for the long-term preservation of digital records. In Proceedings of the 1st international digital preservation interoperability framework symposium. [Em linha]. New York: ACM, 2010. [Consult. 6 Mar. 2014]. Disponível na Internet: <URL: http://dl.acm.org/citation.cfm?doid=2039263.2039270>. ISBN 978-1-4503-0110-7 SWADE, Doron - Preserving software in an object-centred culture. In HIGGS, Edward, ed. lit. History and electronic artefacts, Oxford: Clarendon Press, 1998. ISBN 978-0-19-823633-7, p. 195-206 THIBODEAU, Kenneth - Building the archives of the future: advances in preserving electronic records at the NARA. D-Lib magazine. Vol. 7, nº 2 (2001). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.dlib.org/dlib/february01/thibodeau/02thibodeau.html>. ISSN 1082-9873 THIBODEAU, Kenneth - Overview of technological approaches to digital preservation and challenges in coming years. In The state of digital preservation: an international perspective [Em linha]. Washington, D. C.: Council on Library and Information Resources, 2002. [Consult. 26 Fev. 2014]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/reports/pub107/pub107.pdf>. ISBN 1-887334-92-0 THOMAZ, Katia - Critical factors for digital records preservation. Journal of information, information technology, and organizations [Em linha]. Vol. 1 (2006), p. 21-41 [Consult. 26 Fev. 191 2014]. Disponível na Internet: <URL: http://jiito.org/articles/JIITOv1p021-041Thomaz12.pdf>. ISSN 1557-1327 THOMAZ, Katia - A draft TRAC-DRAMBORA mapping RLG/NARA TRAC with NESTOR CCTDR, DCC/DPE DRAMBORA, ISO27001 and OECD guidelines [Em linha]. [S.l.:s.n.:2008?]. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://wiki.digitalrepositoryauditandcertification.org/pub/Main/DocAnalyses/ComparisonChar t.doc> THOMAZ, Katia; SOARES, Antonio José - A preservação digital e o modelo de referência Open Archival Information System. DataGramaZero: revista de ciência da informação [Em linha]. Rio de Janeiro. Vol. 5, nº 1 (2004). [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://dgz.org.br/fev04/Art_01.htm>. ISSN 1517-3801 TOCCI, Ronald; WIDMER, Neal; MOSS, Gregory - Digital systems: principles and applications. 10ª ed. [S.l.]: Prentice Hall, 2007. ISBN 0-13-173969-7 UNESCO - Charter on the preservation of the digital heritage. In Records of the General Conference 32nd session: vol. 1, Resolutions [Em linha]. Paris, UNESCO, 2003. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://unesdoc.unesco.org/images/0013/001331/133171e.pdf#page=80> UNIÃO EUROPEIA. Comissão - Guidelines on best practices for using electronic information [Em linha]. Luxemburg: DLM Forum; Office for Official Publications of the European Communities, 1997. [Consult. 26 Fev. 2014]. Disponível na Internet: <URL: http://ec.europa.eu/archives/ISPO/dlm/documents/guidelines.html>. ISBN 92-828-2285-0 UNIÃO EUROPEIA. Comissão - Guidelines on data management in Horizon 2020 [Em linha]. v.1.0 Luxemburgo: DLM Forum: Office for Official Publications of the European Communities, 2013. [Consult. 26 Fev. 2014]. Disponível na Internet: <URL: http://ec.europa.eu/research/participants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020hi-oa-data-mgt_en.pdf>. UNIÃO EUROPEIA. Comissão - Guidelines on open access to scientific publications and research data in Horizon 2020 [Em linha]. v.1.0 Luxemburg: DLM Forum: Office for Official Publications of the European Communities, 2013. [Consult. 26 Fev. 2014]. Disponível na Internet: <URL: http://ec.europa.eu/research/par Fev. icipants/data/ref/h2020/grants_manual/hi/oa_pilot/h2020-hi-oa-pilot-guide_en.pdf> UNIÃO EUROPEIA. Comissão – MoReq specification: Model Requirements for the Management of Electronic Records [Em linha]. Brussels: Office for Official Publications of the European Communities, 2001. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL:http://ec.europa.eu/archival-policy/moreq/doc/moreq_en.pdf>. ISBN 92-894-1290-9 UNIÃO EUROPEIA. Comissão – Online survey on scientific information in the digital age [Em linha]. Luxemburg: Office for Official Publications of the European Communities, 2012. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://ec.europa.eu/research/science- 192 society/document_library/pdf_06/survey-on-scientific-information-digital-age_en.pdf>. 978-92-79-23170-4 ISBN UNIVERSITY OF CALIFORNIA. Curation Center - Unified Digital Format Registry [Em linha] [S.l.]: The Regents of the University of California, 2012. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.udfr.org/> VERHEUL, Ingeborg - Networking for digital preservation: current practice in 15 national libraries - IFLA Publications 119 [Em linha]. Munich: Saur: IFLA, 2006. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL:http://www.ifla.org/files/assets/hq/publications/iflapublications-series-119.pdf>. ISBN 3-598-21847-8. VIÑAS, Vicente; VIÑAS, Rute - Traditional restoration techniques: a RAMP study. Paris: UNESCO, 1988. WATERS, Donald; GARRETT, John - Preserving digital information, report of the task force on archiving of digital information [Em linha]. Washington D.C.; Mountain View, Ca.: Commission on Preservation and Access: Research Libraries Group, 1996. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.clir.org/pubs/reports/reports/pub63watersgarrett.pdf>. ISBN 1-88733450-5 WAUGH, Andrew [et al.] - Preserving Digital Information Forever. In Proceedings of the DL 2000 5th. ACM conference on digital libraries [Em linha]. New York: ACM, 2000. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://dl.acm.org/citation.cfm?id=336659>. ISBN 158113-231-X WEBB, Colin [et al.] - Guidelines for the preservation of digital heritage [Em linha]. [S.l.]: UNESCO, 2003. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://unesdoc.unesco.org/images/0013/001300/130071e.pdf>. WHEATLEY, Paul - Institutional repositories in the context of digital preservation [Em linha]. [S.l.]: Digital Preservation Coalition, 2004. [Consult. 11 Nov. 2013]. Disponível na Internet: <URL: http://www.dpconline.org/docs/DPCTWf4word.pdf> Wikipedia contributors – Bit rot. In Wikipedia, the free encyclopedia [Em linha]. actual. 8 Out. 2013. [Consult. 6 Jan. 2014]. Disponível na Internet: <URL: http://en.wikipedia.org/wiki/Bit_rot/> WITTEN, Ian; BAINBRIDGE, David; NICHOLS, David - How to build a digital library [Em linha]. 2nd.Ed. [S.l.]: Morgan Kaufmann Publishers: Elsevier, 2010. [Consult. 11 Nov. 2013]. Disponível parcialmente na WWW: <URL: http://books.google.pt/books?id=HiJNbEy5f70C&lpg=PP1&dq=how%20to%20build%20a%20di gital%20library%20witten&pg=PP1#v=onepage&q&f=false>. ISBN 978-0-12-374857-7 YAKEL, Elizabeth [et al.] - Trust in digital repositories. International journal of digital curation [Em linha]. Vol. 8, nº 1, (2013), p. 143-156. [Consult. 6 Abril. 2014]. Disponível na Internet: <URL: http://www.ijdc.net/index.php/ijdc/article/view/8.1.143>. ISSN 1746-8256 193 YOON, Ayoung - End-users’ trust in data repositories: definition and influences on trust development. Archival science. [Em linha]. Vol. 14, nº 1 (2014), p. 17-34 [Consult. 6 Abril. 2014]. Disponível na Internet: <URL: http://link.springer.com/article/10.1007%2Fs10502-0139207-8>. ISSN 1573-7519 194 ANEXOS 195 Anexo 1 - Tabela comparativa do TRAC TRAC AUDIT & CERTIFICATION CRITERIA> A. Organizational Infrastructure AUDIT & CERTIFICATION CRITERIA> A. Organizational Infrastructure> A1. Governance & organizational viability A1.1 Repository has a mission statement that reflects a commitment to the long-term retention of, management of, and access to digital information. A1.2 Repository has an appropriate, formal succession plan, contingency plans, and/or escrow arrangements in place in case the repository ceases to operate or the governing or funding institution substantially changes its scope. ISO 16363:2012 NESTOR 1 NESTOR 2 3 ORGANIZATIONAL INFRASTRUCTURE 3.1 GOVERNANCE AND ORGANIZATIONAL VIABILITY 3.1.1 The repository shall have a mission statement that reflects a commitment to the preservation of, long term retention of, management of, and access to digital information. 3.1.2.1 The repository shall have an appropriate succession plan, contingency plans, and/or escrow arrangements in place in case the repository ceases to operate or the governing or funding institution substantially changes its scope. 1.2 The digital repository assumes responsibility for long-term preservation of the information represented by the digital objects. 4.5 Continuation of the preservation tasks is ensured even beyond the existence of the digital repository. 1.2 The digital repository assumes responsibility for long-term preservation of the information represented by the digital objects 4.6 Continuation of the preservation tasks is ensured even beyond the existence of the digital repository AUDIT & CERTIFICATION CRITERIA > A. Organizational Infrastructure > A2. Organizational structure & staffing 3.2 ORGANIZATIONAL STRUCTURE AND STAFFING A2.1 Repository has identified and established the duties that it needs to perform and has appointed staff with adequate skills and experience to fulfill these duties. 3.2.1 The repository shall have identified and established the duties that it needs to perform and shall have appointed staff with adequate skills and experience to fulfill these duties. 4.3 Appropriate organisational structures exist for the digital repository. 5.1 All processes and responsibilities have been defined. 4.3 Appropriate organisational structures exist for the digital repository. 5.1 All processes and responsibilities have been defined. A2.2 Repository has the appropriate number of staff to support all functions and services. 3.2.1.2 The repository shall have the appropriate number of staff to support all functions and services. 4.2 Sufficient numbers of appropriately qualified staff are available 4.2 Sufficient numbers of appropriately qualified staff are available 197 TRAC ISO 16363:2012 A2.3 Repository has an active professional development program in place that provides staff with skills and expertise development opportunities. 3.2.1.3 The repository shall have in place an active professional development program that provides staff with skills and expertise development opportunities. AUDIT & CERTIFICATION CRITERIA> A. Organizational Infrastructure> A3. Procedural accountability & policy framework A3.1 Repository has defined its designated community(ies) and associated knowledge base(s) and has publicly accessible definitions and policies in place to dictate how its preservation service requirements will be met. A3.2 Repository has procedures and policies in place, and mechanisms for their review, update, and development as the repository grows and as technology and community practice evolve. A3.3 Repository maintains written policies that specify the nature of any legal permissions required to preserve digital content over time, and repository can demonstrate that these permissions have been acquired when needed. 3.3 PROCEDURAL ACCOUNTABILITY AND PRESERVATION POLICY FRAMEWORK A3.4 Repository is committed to formal, periodic review and assessment to ensure responsiveness to technological developments and evolving requirements. 3.3.2.1 The repository shall have mechanisms for review, update, and ongoing development of its Preservation Policies as the repository grows and as technology and community practice evolve. A3.5 Repository has policies and procedures to ensure that feedback from producers and users is sought and addressed over time. 198 Partly the 3.3.1 The repository shall have defined its Designated Community and associated knowledge base(s) and shall have these definitions appropriately accessible. NESTOR 1 NESTOR 2 1.3 The digital repository has defined its designated community(ies). 1.3 The digital repository has defined its designated community(ies). 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes Partly 3.3.2 The repository shall have Preservation Policies in place to ensure its Preservation Strategic Plan will be met. [Partly] 3.5.1.3 The repository shall have written policies that indicate when it accepts preservation responsibility for contents of each set of submitted data objects. [????] TRAC ISO 16363:2012 A3.6 Repository has a documented history of the changes to its operations, procedures, software, and hardware that, where appropriate, is linked to relevant preservation strategies and describes potential effects on preserving digital content. A3.7 Repository commits to transparency and accountability in all actions supporting the operation and management of the repository, especially those that affect the preservation of digital content over time. A3.8 Repository commits to defining, collecting, tracking, and providing, on demand, its information integrity measurements. A3.9 Repository commits to a regular schedule of selfassessment and certification and, if certified, commits to notifying certifying bodies of operational changes that will change or nullify its certification status. AUDIT & CERTIFICATION CRITERIA> A. Organizational Infrastructure> A4. Financial sustainability 3.3.3 The repository shall have a documented history of the changes to its operations, procedures, software, and hardware. A4.1 Repository has short- and long-term business planning processes in place to sustain the repository over time. A4.2 Repository has in place processes to review and adjust business plans at least annually. A4.3 Repository’s financial practices and procedures are transparent, compliant with relevant accounting standards and practices, and audited by third parties in accordance with territorial legal requirements. 3.4.1 The repository shall have short- and long-term business planning processes in place to sustain the repository over time. NESTOR 1 NESTOR 2 3.3.4 The repository shall commit to transparency and accountability in all actions supporting the operation and management of the repository that affect the preservation of digital content over time. 3.3.5 The repository shall define, collect, track, and appropriately provide its information integrity measurements. 3.3.6 The repository shall commit to a regular schedule of self-assessment and external certification. 3.4 FINANCIAL SUSTAINABILITY 4.1 Adequate financing of the digital repository is secured. 4.1 Adequate financing of the digital repository is secured 3.4.2 The repository shall have financial practices and procedures which are transparent, compliant with relevant accounting standards and practices, and audited by third parties in accordance with territorial legal requirements. 199 TRAC A4.4 Repository has ongoing commitment to analyze and report on risk, benefit, investment, and expenditure (including assets, licenses, and liabilities). A4.5 Repository commits to monitoring for and bridging gaps in funding. ISO 16363:2012 NESTOR 1 NESTOR 2 3.4.3 The repository shall have an ongoing commitment to analyze and report on financial risk, benefit, investment, and expenditure (including assets, licenses, and liabilities). 3.1.2.2 The repository shall monitor its organizational environment to determine when to execute its succession plan, contingency plans, and/or escrow arrangements. [Em parte] AUDIT & CERTIFICATION CRITERIA> A. Organizational Infrastructure> A5. Contracts, licenses, & liabilities A5.1 If repository manages, preserves, and/or provides access to digital materials on behalf of another organization, it has and maintains appropriate contracts or deposit agreements. A5.2 Repository contracts or deposit agreements must specify and transfer all necessary preservation rights, and those rights transferred must be documented. A5.3 Repository has specified all appropriate aspects of acquisition, maintenance, access, and withdrawal in written agreements with depositors and other relevant parties. A5.4 Repository tracks and manages intellectual property rights and restrictions on use of repository content as required by deposit agreement, contract, or license. 200 3.5.1 The repository shall have and maintain appropriate contracts or deposit agreements for digital materials that it manages, preserves, and/or to which it provides access. 3.5.1.1 The repository shall have contracts or deposit agreements which specify and transfer all necessary preservation rights, and those rights transferred shall be documented. 3.5.1.2 The repository shall have specified all appropriate aspects of acquisition, maintenance, access, and withdrawal in written agreements with depositors and other relevant parties. 3.1 Legal contracts exist between producers and the digital repository. 3.1 Legal contracts exist between producers and the digital repository 3.2 In carrying out its archiving tasks, the digital repository acts on the basis of legal rulings. 3.2 In carrying out its archiving tasks, the digital repository acts on the basis of legal arrangements 3.5.2 The repository shall track and manage intellectual property rights and restrictions on use of repository content as required by deposit agreement, contract, or license. 12.6 The DR acquires adequate metadata to record the corresponding usage rights and conditions. ??? 12.6 The DR acquires adequate metadata to record the corresponding usage rights and conditions. ??? TRAC ISO 16363:2012 A5.5 If repository ingests digital content with unclear ownership/rights, policies are in place to address liability and challenges to those rights. 3.5.1.4 The repository shall have policies in place to address liability and challenges to ownership/rights. AUDIT & CERTIFICATION CRITERIA> B. Digital Object Management 4 DIGITAL OBJECT MANAGEMENT AUDIT & CERTIFICATION CRITERIA> B. Digital Object Management> B1. Ingest: acquisition of content 4.1 INGEST: ACQUISITION OF CONTENT B1.1 Repository identifies properties it will preserve for digital objects. 4.1.1 The repository shall identify the Content Information and the Information Properties that the repository will preserve. B1.2 Repository clearly specifies the information that needs to be associated with digital material at the time of its deposit (i.e., SIP). 4.1.2 The repository shall clearly specify the information that needs to be associated with specific Content Information at the time of its deposit. 4.1.4 The repository shall have mechanisms to appropriately verify the identity of the Producer of all materials. B1.3 Repository has mechanisms to authenticate the source of all materials. B1.4 Repository’s ingest process verifies each submitted object (i.e., SIP) for completeness and correctness as specified in B1.2. B1.5 Repository obtains sufficient physical control over the digital objects to preserve them. 4.1.5 The repository shall have an ingest process which verifies each SIP for completeness and correctness. 4.1.6 The repository shall obtain sufficient control over the Digital Objects to preserve them. NESTOR 1 NESTOR 2 1.1 The digital repository has developed criteria for the selection of its digital objects. 9.2 The digital repository identifies which characteristics of the digital objects are significant for information preservation. 9.1 The digital repository specifies its transfer objects (Submission Information Packages, SIPs). 7.1 Ingest: the digital repository ensures the authenticity of the digital objects. 6.1 Ingest: the digital repository ensures the integrity of the digital objects. 9.3 The digital repository has technical control of the digital objects in order to carry out long-term preservation measures. 1.1 The digital repository has developed criteria for the selection of its digital objects 9.2 The digital repository identifies which characteristics of the digital objects are significant for information preservation. 9.1 The digital repository specifies its transfer objects (Submission Information Packages, SIPs). 7.1 Ingest: the digital repository ensures the authenticity of the digital objects. 6.1 Ingest: the digital repository ensures the integrity of the digital objects 9.3 The digital repository has technical control of the digital objects in order to carry out long-term preservation measures. 201 TRAC ISO 16363:2012 B1.6 Repository provides producer/depositor with appropriate responses at predefined points during the ingest processes. 4.1.7 The repository shall provide the producer/depositor with appropriate responses at agreed points during the ingest processes. 3.5.1.3 The repository shall have written policies that indicate when it accepts preservation responsibility for contents of each set of submitted data objects. 4.1.8 The repository shall have contemporaneous records of actions and administration processes that are relevant to content acquisition. 4.2 INGEST: CREATION OF THE AIP B1.7 Repository can demonstrate when preservation responsibility is formally accepted for the contents of the submitted data objects (i.e., SIPs). B1.8 Repository has contemporaneous records of actions and administration processes that are relevant to preservation (Ingest: content acquisition). AUDIT & CERTIFICATION CRITERIA > B. Digital Object Management > B2. Ingest: creation of the archivable package B2.1 Repository has an identifiable, written definition for each AIP or class of information preserved by the repository. 4.2.1.1 The repository shall be able to identify which definition applies to which AIP. B2.2 Repository has a definition of each AIP (or class) that is adequate to fit long-term preservation needs. 4.2.1.2 The repository shall have a definition of each AIP that is adequate for long-term preservation, enabling the identification and parsing of all the required components within that AIP. B2.3 Repository has a description of how AIPs are constructed from SIPs. 4.2.2 The repository shall have a description of how AIPs are constructed from SIPs. 202 NESTOR 1 NESTOR 2 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 10.2 The digital repository takes care of transforming the transfer objects (SIPs) into archival objects (AIPs). 10.2 The digital repository takes care of transforming the transfer objects (SIPs) into archival objects (AIPs). TRAC ISO 16363:2012 B2.4 Repository can demonstrate that all submitted objects (i.e., SIPs) are either accepted as whole or part of an eventual archival object (i.e., AIP), or otherwise disposed of in a recorded fashion. 4.2.3 The repository shall document the final disposition of all SIPs. 4.2.3.1 The repository shall follow documented procedures if a SIP is not incorporated into an AIP or discarded and shall indicate why the SIP was not incorporated or discarded. 4.2.4 The repository shall have and use a convention that generates persistent, unique identifiers for all AIPs. B2.5 Repository has and uses a naming convention that generates visible, persistent, unique identifiers for all archived objects (i.e., AIPs). B2.6 If unique identifiers are associated with SIPs before ingest, the repository preserves the identifiers in a way that maintains a persistent association with the resultant archived object (e.g., AIP). B2.7 Repository demonstrates that it has access to necessary tools and resources to establish authoritative semantic or technical context of the digital objects it contains (i.e., access to appropriate international Representation Information and format registries). NESTOR 1 12.1 The digital repository uniquely and permanently identifies its objects and their relationships. NESTOR 2 12.1 The digital repository uniquely and persistently identifies its objects and their relationships. 4.2.5 The repository shall have access to necessary tools and resources to provide authoritative Representation Information for all of the digital objects it contains. 203 TRAC B2.8 Repository records/registers Representation Information (including formats) ingested. B2.9 Repository acquires preservation metadata (i.e., PDI) for its associated Content Information. 204 ISO 16363:2012 NESTOR 1 NESTOR 2 4.2.5.1 The repository shall have tools or methods to identify the file type of all submitted Data Objects. 4.2.5.2 The repository shall have tools or methods to determine what Representation Information is necessary to make each Data Object understandable to the Designated Community. [????] 4.2.5.3 The repository shall have access to the requisite Representation Information. [????] 4.2.5.4 The repository shall have tools or methods to ensure that the requisite Representation Information is persistently associated with the relevant Data Objects. [????] 4.2.6 The repository shall have documented processes for acquiring Preservation Description Information (PDI) for its associated Content Information and acquire PDI in accordance with the documented processes. 12.3 The digital repository acquires adequate metadata for structural description of the digital objects. 12.5 The digital repository acquires adequate metadata for technical description of the digital objects. 12.3 The digital repository acquires adequate metadata for structural description of the digital objects. 12.5 The digital repository acquires adequate metadata for technical description of the digital objects. 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. TRAC ISO 16363:2012 B2.10 Repository has a documented process for testing understandability of the information content and bringing the information content up to the agreed level of understandability. 4.2.7 The repository shall ensure that the Content Information of the AIPs is understandable for their Designated Community at the time of creation of the AIP. 4.2.7.1 Repository shall have a documented process for testing understandability for their Designated Communities of the Content Information of the AIPs at their creation. 4.2.7.2 The repository shall execute the testing process for each class of Content Information of the AIPs. 4.2.7.3 The repository shall bring the Content Information of the AIP up to the required level of understandability if it fails the understandability testing. 4.2.8 The repository shall verify each AIP for completeness and correctness at the point it is created. 4.2.9 The repository shall provide an independent mechanism for verifying the integrity of the repository collection/content. B2.11 Repository verifies each AIP for completeness and correctness at the point it is generated. B2.12 Repository provides an independent mechanism for audit of the integrity of the repository collection/content. B2.13 Repository has contemporaneous records of actions and administration processes that are relevant to preservation (AIP creation). AUDIT & CERTIFICATION CRITERIA > B. Digital Object Management > B3. Preservation planning B3.1 Repository has documented preservation strategies. NESTOR 1 NESTOR 2 2.2 The digital repository ensures that the designated community can interpret the digital objects. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 6.1 Ingest: the digital repository ensures the integrity of the digital objects. 6.1 Ingest: the digital repository ensures the integrity of the digital objects. 4.4 The digital repository engages in long-term planning. 8 The digital repository has a strategic plan for its technical preservation 4.4 The digital repository engages in long-term planning. 8 The digital repository has a strategic plan for its technical preservation 4.2.10 The repository shall have contemporaneous records of actions and administration processes that are relevant to AIP creation. 4.3 PRESERVATION PLANNING 4.3.1 The repository shall have documented preservation strategies relevant to its holdings 205 TRAC B3.2 Repository has mechanisms in place for monitoring and notification when Representation Information (including formats) approaches obsolescence or is no longer viable. B3.3 Repository has mechanisms to change its preservation plans as a result of its monitoring activities. B3.4 Repository can provide evidence of the effectiveness of its preservation planning. AUDIT & CERTIFICATION CRITERIA > B. Digital Object Management > B4. Archival storage & preservation/maintenance of AIPs B4.1 Repository employs documented preservation strategies. B4.2 Repository implements/responds to strategies for archival object (i.e., AIP) storage and migration. B4.3 Repository preserves the Content Information of archival objects (i.e., AIPs). 206 ISO 16363:2012 4.3.2 The repository shall have mechanisms in place for monitoring its preservation environment. 4.3.2.1 The repository shall have mechanisms in place for monitoring and notification when Representation Information is inadequate for the Designated Community to understand the data holdings. 4.3.3 The repository shall have mechanisms to change its preservation plans as a result of its monitoring activities. 4.3.4 The repository shall provide evidence of the effectiveness of its preservation activities. 4.4 AIP PRESERVATION 4.4.1 The repository shall have specifications for how the AIPs are stored down to the bit level. 4.4.1.1 The repository shall preserve the Content Information of AIPs. NESTOR 1 NESTOR 2 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 10.4 The digital repository implements strategies for the long-term preservation of the AIPs. 10.4 The digital repository implements strategies for the long-term preservation of the AIPs. TRAC ISO 16363:2012 B4.4 Repository actively monitors integrity of archival objects (i.e., AIPs). 4.4.1.2 The repository shall actively monitor the integrity of AIPs. B4.5 Repository has contemporaneous records of actions and administration processes that are relevant to preservation (Archival Storage). 4.4.2 The repository shall have contemporaneous records of actions and administration processes that are relevant to storage and preservation of the AIPs. 4.5 INFORMATION MANAGEMENT AUDIT & CERTIFICATION CRITERIA > B. Digital Object Management > B5. Information management B5.1 Repository articulates minimum metadata requirements to enable the designated community(ies) to discover and identify material of interest. B5.2 Repository captures or creates minimum descriptive metadata and ensures that it is associated with the archived object (i.e., AIP). 4.5.1 The repository shall specify minimum information requirements to enable the Designated Community to discover and identify material of interest. 4.5.2 The repository shall capture or create minimum descriptive information and ensure that it is associated with the AIP. B5.3 Repository can demonstrate that referential integrity is created between all archived objects (i.e., AIPs) and associated descriptive information. B5.4 Repository can demonstrate that referential integrity is maintained between all archived objects (i.e., AIPs) and associated descriptive information. 4.5.3 The repository shall maintain bidirectional linkage between each AIP and its descriptive information. 4.5.3.1 The repository shall maintain the associations between its AIPs and their descriptive information over time. NESTOR 1 NESTOR 2 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 7.2 Archival Storage: the digital repository ensures the authenticity of the digital 10.3 The digital repository guarantees the storage and readability of the AIPs. 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 7.2 Archival Storage: the digital repository ensures the authenticity of the digital 10.3 The digital repository guarantees the storage and readability of the AIPs. 12.2 The digital repository acquires adequate metadata for formal and content- based description and identification of the digital objects. 12.7 The assignment of metadata to the digital objects is guaranteed at all times. 12.7 The assignment of metadata to the digital objects is guaranteed at all times. 12.2 The digital repository acquires adequate metadata for formal and content- based description and identification of the digital objects 12.7 The package structure is preserved at all at all times 12.7 The package structure is preserved at all at all times 207 TRAC ISO 16363:2012 AUDIT & CERTIFICATION CRITERIA > B. Digital Object Management > B6. Access management 4.6 ACCESS MANAGEMENT B6.1 Repository documents and communicates to its designated community(ies) what access and delivery options are available. 4.6.1 The repository shall comply with Access Policies. [???] B6.2 Repository has implemented a policy for recording all access actions (includes requests, orders etc.) that meet the requirements of the repository and information producers/depositors. B6.3 Repository ensures that agreements applicable to access conditions are adhered to. B6.4 Repository has documented and implemented access policies (authorization rules, authentication requirements) consistent with deposit agreements for stored objects. B6.5 Repository access management system fully implements access policy. B6.6 Repository logs all access management failures, and staff review inappropriate “access denial” incidents. 208 4.6.1 The repository shall comply with Access Policies. 4.6.1.1 The repository shall log and review all access management failures and anomalies. NESTOR 1 NESTOR 2 2.1 The digital repository ensures its designated community can access the digital objects. 11.1 The digital repository defines its usage objects (Dissemination Information Packages, DIPs) 11.2 The digital repository ensures transformation of AIPs into DIPs. 2.1 The digital repository ensures its designated community can access the digital objects. 11.1 The digital repository defines its usage objects (Dissemination Information Packages, DIPs) 11.2 The digital repository ensures transformation of AIPs into DIPs. 3.3 With regard to use, the digital repository acts on the basis of legal requirements. 3.3 With regard to use, the digital repository acts on the basis of legal arrangements. 6.3 Access: the digital repository ensures the integrity of the digital objects. 6.3 Access: the digital repository ensures the integrity of the digital objects. TRAC ISO 16363:2012 B6.7 Repository can demonstrate that the process that generates the requested digital object(s) (i.e., DIP) is completed in relation to the request. B6.8 Repository can demonstrate that the process that generates the requested digital object(s) (i.e., DIP) is correct in relation to the request. B6.9 Repository demonstrates that all access requests result in a response of acceptance or rejection. 4.6.2.1 The repository shall record and act upon problem reports about errors in data or responses from users. [????] 4.6.2.1 The repository shall record and act upon problem reports about errors in data or responses from users. [????] 4.6.2.1 The repository shall record and act upon problem reports about errors in data or responses from users. [????] 4.6.2 The repository shall follow policies and procedures that enable the dissemination of digital objects that are traceable to the originals, with evidence supporting their authenticity. B6.10 Repository enables the dissemination of authentic copies of the original or objects traceable to originals. AUDIT & CERTIFICATION CRITERIA > C. Technologies, Technical Infrastructure, & Security AUDIT & CERTIFICATION CRITERIA > C. Technologies, Technical Infrastructure, & Security > C1. System infrastructure 5 INFRASTRUCTURE AND SECURITY RISK MANAGEMENT 5.1 TECHNICAL INFRASTRUCTURE RISK MANAGEMENT C1.1 Repository functions on well-supported operating systems and other core infrastructural software. 5.1.1 The repository shall identify and manage the risks to its preservation operations and goals associated with system infrastructure.[????] 5.1.1.2 The repository shall have adequate hardware and software support for backup functionality sufficient for preserving the repository content and tracking repository functions. C1.2 Repository ensures that it has adequate hardware and software support for backup functionality sufficient for the repository’s services and for the data held, e.g., metadata associated with access controls, repository main content. NESTOR 1 NESTOR 2 7.3 Access: the digital repository ensures the authenticity of the digital objects. 7.3 Access: the digital repository ensures the authenticity of the digital objects. 5.2 The digital repository documents all its elements based on a defined process. 13.1 The IT infrastructure implements the object management demands. 5.2 The digital repository documents all its elements based on a defined process. 13.1 The IT infrastructure implements the object management demands. 209 TRAC C1.3 Repository manages the number and location of copies of all digital objects. C1.4 Repository has mechanisms in place to ensure any/multiple copies of digital objects are synchronized. C1.5 Repository has effective mechanisms to detect bit corruption or loss. C1.6 Repository reports to its administration all incidents of data corruption or loss, and steps taken to repair/replace corrupt or lost data. C1.7 Repository has defined processes for storage media and/or hardware change (e.g., refreshing, migration). C1.8 Repository has a documented change management process that identifies changes to critical processes that potentially affect the repository’s ability to comply with its mandatory responsibilities. C1.9 Repository has a process for testing the effect of critical changes to the system. C1.10 Repository has a process to react to the availability of new software security updates based on a risk-benefit assessment. AUDIT & CERTIFICATION CRITERIA > C. Technologies, Technical Infrastructure, & Security > C2. Appropriate technologies 210 ISO 16363:2012 5.1.2 The repository shall manage the number and location of copies of all digital objects. 5.1.2.1 The repository shall have mechanisms in place to ensure any/multiple copies of digital objects are synchronized. 5.1.1.3 The repository shall have effective mechanisms to detect bit corruption or loss. 5.1.1.3.1 The repository shall record and report to its administration all incidents of data corruption or loss, and steps shall be taken to repair/replace corrupt or lost data. 5.1.1.5 The repository shall have defined processes for storage media and/or hardware change (e.g., refreshing, migration). 5.1.1.6.1 The repository shall have a documented change management process that identifies changes to critical processes that potentially affect the repository’s ability to comply with its mandatory responsibilities. 5.1.1.6.2 The repository shall have a process for testing and evaluating the effect of changes to the repository’s critical processes. 5.1.1.4 The repository shall have a process to record and react to the availability of new security updates based on a risk-benefit assessment. NESTOR 1 NESTOR 2 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes TRAC C2.1 Repository has hardware technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when hardware technology changes are needed. C2.2 Repository has software technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when software technology changes are needed. AUDIT & CERTIFICATION CRITERIA > C. Technologies, Technical Infrastructure, & Security > C3. Security ISO 16363:2012 5.1.1.1 The repository shall employ technology watches or other technology monitoring notification systems. 5.1.1.1.1 The repository shall have hardware technologies appropriate to the services it provides to its designated communities. 5.1.1.1.3 The repository shall have procedures in place to evaluate when changes are needed to current hardware. 5.1.1.1.4 The repository shall have procedures, commitment and funding to replace hardware when evaluation indicates the need to do so. [????] 5.1.1.1 The repository shall employ technology watches or other technology monitoring notification systems. 5.1.1.1.5 The repository shall have software technologies appropriate to the services it provides to its designated communities. 5.1.1.1.6 The repository shall have procedures in place to monitor and receive notifications when software changes are needed. 5.1.1.1.7 The repository shall have procedures in place to evaluate when changes are needed to current software. 5.1.1.1.8 The repository shall have procedures, commitment, and funding to replace software when evaluation indicates the need to do so.[????] 5.2 SECURITY RISK MANAGEMENT NESTOR 1 NESTOR 2 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 211 TRAC ISO 16363:2012 NESTOR 1 NESTOR 2 C3.1 Repository maintains a systematic analysis of such factors as data, systems, personnel, physical plant, and security needs. 5.2.1 The repository shall maintain a systematic analysis of security risk factors associated with data, systems, personnel, and physical plant. 5.2.2 The repository shall have implemented controls to adequately address each of the defined security risks 14 The infrastructure protects the digital repository and its digital objects. 14 The infrastructure protects the digital repository and its digital objects. 13.2 The IT infrastructure implements the security demands of the IT security system. 13.2 The IT infrastructure implements the security requirements of the IT security system C3.2 Repository has implemented controls to adequately address each of the defined security needs. C3.3 Repository staff have delineated roles, responsibilities, and authorizations related to implementing changes within the system. C3.4 Repository has suitable written disaster preparedness and recovery plan(s), including at least one off-site backup of all preserved information together with an off-site copy of the recovery plan(s). 212 5.2.3 The repository staff shall have delineated roles, responsibilities, and authorizations related to implementing changes within the system. 5.2.4 The repository shall have suitable written disaster preparedness and recovery plan(s), including at least one off-site backup of all preserved information together with an offsite copy of the recovery plan(s). Anexo 2: Tabela Comparativa do NESTOR (2ª Edição) NESTOR 2 A Organisational framework 1 The DR has defined its goals. 1.1 The DR has developed criteria for the selection of its digital objects. 1.2 The DR assumes responsibility for longterm preservation of the information represented by the digital objects. 1.3 The DR has defined its designated community/communities. 2 The DR grants its designated community/communities adequate access to the information represented by the digital objects. 2.1 The DR ensures its designated community/communities can access the digital objects. ISO 16363:2012 TRAC A. Organizational Infrastructure 4.1 INGEST: ACQUISITION OF CONTENT 3.1.1 The repository shall have a mission statement that reflects a commitment to the preservation of, long term retention of, management of, and access to digital information. Partly the 3.3.1 The repository shall have defined its Designated Community and associated knowledge base(s) and shall have these definitions appropriately accessible. 4.6 ACCESS MANAGEMENT B. Digital Object Management> B1. Ingest: acquisition of content A1.1 Repository has a mission statement that reflects a commitment to the long-term retention of, management of, and access to digital information. A3.1 Repository has defined its designated community(ies) and associated knowledge base(s) and has publicly accessible definitions and policies in place to dictate how its preservation service requirements will be met. B. Digital Object Management > B6. Access management 213 NESTOR 2 2.2 The DR ensures that the designated community/communities can interpret the digital objects. 3 Legal and contractual rules are observed. 3.1 Legal contracts exist between producers and the digital repository. 3.2 In carrying out its archiving tasks, the DR acts on the basis of legal arrangements. 3.3 With regard to use, the DR acts on the basis of legal arrangements. 4 The organisational form is appropriate for the DR. 4.1 Adequate financing of the digital repository is secured. 4.2 Sufficient numbers of appropriately qualified staff are available. 214 ISO 16363:2012 TRAC 4.2.7 The repository shall ensure that the Content Information of the AIPs is understandable for their Designated Community at the time of creation of the AIP. 4.2.7.1 Repository shall have a documented process for testing understandability for their Designated Communities of the Content Information of the AIPs at their creation. 4.2.7.2 The repository shall execute the testing process for each class of Content Information of the AIPs. 4.2.7.3 The repository shall bring the Content Information of the AIP up to the required level of understandability if it fails the understandability testing. B2.10 Repository has a documented process for testing understandability of the information content and bringing the information content up to the agreed level of understandability. 3.5.1 The repository shall have and maintain appropriate contracts or deposit agreements for digital materials that it manages, preserves, and/or to which it provides access. 3.5.1.2 The repository shall have specified all appropriate aspects of acquisition, maintenance, access, and withdrawal in written agreements with depositors and other relevant parties. A5.1 If repository manages, preserves, and/or provides access to digital materials on behalf of another organization, it has and maintains appropriate contracts or deposit agreements. A5.3 Repository has specified all appropriate aspects of acquisition, maintenance, access, and withdrawal in written agreements with depositors and other relevant parties. B6.3 Repository ensures that agreements applicable to access conditions are adhered to. 3.4.1 The repository shall have short- and long-term business planning processes in place to sustain the repository over time 3.2.1.2 The repository shall have the appropriate number of staff to support all functions and services. A4.1 Repository has short- and long-term business planning processes in place to sustain the repository over time. A2.2 Repository has the appropriate number of staff to support all functions and services. NESTOR 2 4.3 Appropriate organisational structures exist for the DR. 4.4 The DR engages in long-term planning. ISO 16363:2012 3.2.1 The repository shall have identified and established the duties that it needs to perform and shall have appointed staff with adequate skills and experience to fulfill these duties. 4.3.1 The repository shall have documented preservation strategies relevant to its holdings TRAC A2.1 Repository has identified and established the duties that it needs to perform and has appointed staff with adequate skills and experience to fulfill these duties. B3.1 Repository has documented preservation strategies. 215 NESTOR 2 4.5 The DR reacts to substantial changes. 216 ISO 16363:2012 TRAC 3.3.2.1 The repository shall have mechanisms for review, update, and ongoing development of its Preservation Policies as the repository grows and as technology and community practice evolve. 4.3.3 The repository shall have mechanisms to change its preservation plans as a result of its monitoring activities. 5.1.1.1 The repository shall employ technology watches or other technology monitoring notification systems. 5.1.1.1.3 The repository shall have procedures in place to evaluate when changes are needed to current hardware. 5.1.1.1.4 The repository shall have procedures, commitment and funding to replace hardware when evaluation indicates the need to do so. 5.1.1.1.6 The repository shall have procedures in place to monitor and receive notifications when software changes are needed. 5.1.1.1.7 The repository shall have procedures in place to evaluate when changes are needed to current software. 5.1.1.1.8 The repository shall have procedures, commitment, and funding to replace software when evaluation indicates the need to do so. 5.1.1.6.1 The repository shall have a documented change management process that identifies changes to critical processes that potentially affect the repository’s ability to comply with its mandatory responsibilities. 5.1.1.6.2 The repository shall have a process for testing and evaluating the effect of changes to the repository’s critical processes. 5.1.1.4 The repository shall have a process to record and react to the availability of new security updates based on a risk-benefit assessment. A3.4 Repository is committed to formal, periodic review and assessment to ensure responsiveness to technological developments and evolving requirements. B3.3 Repository has mechanisms to change its preservation plans as a result of its monitoring activities. C1.8 Repository has a documented change management process that identifies changes to critical processes that potentially affect the repository’s ability to comply with its mandatory responsibilities. C1.9 Repository has a process for testing the effect of critical changes to the system. C1.10 Repository has a process to react to the availability of new software security updates based on a risk-benefit assessment C2.1 Repository has hardware technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when hardware technology changes are needed. C2.2 Repository has software technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when software technology changes are needed. NESTOR 2 4.6 Continuation of the preservation tasks is ensured even beyond the existence of the DR. 5 The digital repository undertakes appropriate quality management. 5.1 All processes and responsibilities have been defined. 5.2 The DR documents all its elements based on a defined process. B Object management 6 The DR ensures the integrity of the digital objects during all processing stages. 6.1 Ingest: the DR ensures the integrity of the digital objects. 6.2 Archival Storage: the DR ensures the integrity of the digital objects. 6.3 Access: the DR ensures the integrity of the digital objects. 7 The DR ensures the authenticity of the digital objects during all processing stages. 7.1 Ingest: the DR ensures the authenticity of the digital objects. ISO 16363:2012 TRAC 3.1.2.1 The repository shall have an appropriate succession plan, contingency plans, and/or escrow arrangements in place in case the repository ceases to operate or the governing or funding institution substantially changes its scope A1.2 Repository has an appropriate, formal succession plan, contingency plans, and/or escrow arrangements in place in case the repository ceases to operate or the governing or funding institution substantially changes its scope. 3.2.1 The repository shall have identified and established the duties that it needs to perform and shall have appointed staff with adequate skills and experience to fulfill these duties. 5.1 TECHNICAL INFRASTRUCTURE RISK MANAGEMENT A2.1 Repository has identified and established the duties that it needs to perform and has appointed staff with adequate skills and experience to fulfill these duties. 4.1.5 The repository shall have an ingest process which verifies each SIP for completeness and correctness. 4.2.9 The repository shall provide an independent mechanism for verifying the integrity of the repository collection/content. 4.4.1.2 The repository shall actively monitor the integrity of AIPs 5.1.1.3 The repository shall have effective mechanisms to detect bit corruption or loss. 4.6.1 The repository shall comply with Access Policies B1.4 Repository’s ingest process verifies each submitted object (i.e., SIP) for completeness and correctness as specified in B1.2. B2.12 Repository provides an independent mechanism for audit of the integrity of the repository collection/content B4.4 Repository actively monitors integrity of archival objects (i.e., AIPs). C1.5 Repository has effective mechanisms to detect bit corruption or loss B6.5 Repository access management system fully implements access policy. 4.1.4 The repository shall have mechanisms to appropriately verify the identity of the Producer of all materials. B1.3 Repository has mechanisms to authenticate the source of all materials. C. Technologies, Technical Infrastructure, & Security > C1. System infrastructure 217 NESTOR 2 7.2 Archival Storage: the DR ensures the authenticity of the digital objects. 7.3 Access: the DR ensures the authenticity of the digital objects. 8 The DR has a strategic plan for its technical preservation measures. 9 The DR accepts digital objects from the producers based on defined criteria. 9.1 The DR specifies its submission information packages (SIPs). 9.2 The DR identifies which characteristics of the digital objects are significant for information preservation. 9.3 The DR has technical control of the digital objects in order to carry out long-term preservation measures. 10 Archival storage of the digital objects is undertaken to defined specifications. 10.1 The DR defines its archival information packages (AIPs). 218 ISO 16363:2012 TRAC 4.4.1.2 The repository shall actively monitor the integrity of AIPs 4.4.2 The repository shall have contemporaneous records of actions and administration processes that are relevant to storage and preservation of the AIPs. 4.6.2 The repository shall follow policies and procedures that enable the dissemination of digital objects that are traceable to the originals, with evidence supporting their authenticity. 3.1.2 The repository shall have a Preservation Strategic Plan that defines the approach the repository will take in the long-term support of its mission. 4.3.1 The repository shall have documented preservation strategies relevant to its holdings. B4.4 Repository actively monitors integrity of archival objects (i.e., AIPs). 4.1.2 The repository shall clearly specify the information that needs to be associated with specific Content Information at the time of its deposit. 4.1.1 The repository shall identify the Content Information and the Information Properties that the repository will preserve. 4.1.6 The repository shall obtain sufficient control over the Digital Objects to preserve them. B1.2 Repository clearly specifies the information that needs to be associated with digital material at the time of its deposit (i.e., SIP). B1.1 Repository identifies properties it will preserve for digital objects. 4.2.1.1 The repository shall be able to identify which definition applies to which AIP. 4.2.1.2 The repository shall have a definition of each AIP that is adequate for long-term preservation, enabling the identification and parsing of all the required components B2.1 Repository has an identifiable, written definition for each AIP or class of information preserved by the repository. B2.2 Repository has a definition of each AIP (or class) that is adequate to fit long-term preservation needs B6.10 Repository enables the dissemination of authentic copies of the original or objects traceable to originals. B1.5 Repository obtains sufficient physical control over the digital objects to preserve them. NESTOR 2 ISO 16363:2012 TRAC within that AIP. 10.2 The DR takes care of transforming the submission information packages (SIPs) into archival information packages (AIPs). 10.3 The DR guarantees the storage and readability of the archival information packages (AIPs). 10.4 The DR implements strategies for the long-term preservation of the archival information packages (AIPs). 11 The DR permits usage of the digital objects based on defined criteria. 11.1 The DR defines its dissemination information packages (DIPs). 11.2 The DR ensures transformation of archival information packages (AIPs) into dissemination information packages (DIPs). 12 The data management system is capable of providing the necessary digital repository functions. 12.1 The DR uniquely and permanently identifies its objects and their relationships. 12.2 The DR records adequate metadata for formal and content-based description and identification of the digital objects. 4.2.2 The repository shall have a description of how AIPs are constructed from SIPs. B2.3 Repository has a description of how AIPs are constructed from SIPs. 4.4.1.2 The repository shall actively monitor the integrity of AIPs B4.4 Repository actively monitors integrity of archival objects (i.e., AIPs). 3.1.2 The repository shall have a Preservation Strategic Plan that defines the approach the repository will take in the long-term support of its mission. 4.3.1 The repository shall have documented preservation strategies relevant to its holdings. B4.2 Repository implements/responds to strategies for archival object (i.e., AIP) storage and migration. 4.6 ACCESS MANAGEMENT B. Digital Object Management> B6. Access management 4.6 ACCESS MANAGEMENT B. Digital Object Management> B6. Access management 4.2.4 The repository shall have and use a convention that generates persistent, unique identifiers for all AIPs. B2.5 Repository has and uses a naming convention that generates visible, persistent, unique identifiers for all archived objects (i.e., AIPs). B5.2 Repository captures or creates minimum descriptive metadata and ensures that it is associated with the archived object (i.e., AIP). 4.5.2 The repository shall capture or create minimum descriptive information and ensure that it is associated with the AIP. 219 NESTOR 2 ISO 16363:2012 TRAC 12.3 The DR records adequate metadata for structural description of the digital objects. 4.2.5.2 The repository shall have tools or methods to determine what Representation Information is necessary to make each Data Object understandable to the Designated Community. ??? 4.2.5.3 The repository shall have access to the requisite Representation Information. ??? 4.2.5.4 The repository shall have tools or methods to ensure that the requisite Representation Information is persistently associated with the relevant Data Objects. [???] 4.2.6 The repository shall have documented processes for acquiring Preservation Description Information (PDI) for its associated Content Information and acquire PDI in accordance with the documented processes. 4.2.5.1 The repository shall have tools or methods to identify the file type of all submitted Data Objects. 4.2.6 The repository shall have documented processes for acquiring Preservation Description Information (PDI) for its associated Content Information and acquire PDI in accordance with the documented processes. B2.8 Repository records/registers Representation Information (including formats) ingested. 12.4 The DR records adequate metadata to record all the changes made by the digital repository to the digital objects. 12.5 The DR acquires adequate metadata for technical description of the digital objects. 12.6 The DR acquires adequate metadata to record the corresponding usage rights and conditions. 12.7 The package structure is preserved at all times. C. Infrastructure and Security 13 The IT infrastructure is adequate. 13.1 The IT infrastructure implements the object management requirements. 220 4.5.3 The repository shall maintain bi-directional linkage between each AIP and its descriptive information. 4.5.3.1 The repository shall maintain the associations between its AIPs and their descriptive information over time. 5.1 TECHNICAL INFRASTRUCTURE RISK MANAGEMENT B2.9 Repository acquires preservation metadata (i.e., PDI) for its associated Content Information. B2.8 Repository records/registers Representation Information (including formats) ingested. A5.4 Repository tracks and manages intellectual property rights and restrictions on use of repository content as required by deposit agreement, contract, or license.[?????] B2.9 Repository acquires preservation metadata (i.e., PDI) for its associated Content Information. B5.3 Repository can demonstrate that referential integrity is created between all archived objects (i.e., AIPs) and associated descriptive information. B5.4 Repository can demonstrate that referential integrity is maintained between all archived objects (i.e., AIPs) and associated descriptive information. C. Technologies, Technical Infrastructure, & Security > C1. System infrastructure NESTOR 2 13.2 The IT infrastructure implements the security requirements of the IT security system. 14 The infrastructure protects the digital repository and its digital objects. ISO 16363:2012 TRAC 5.2.2 The repository shall have implemented controls to adequately address each of the defined security risks C3.2 Repository has implemented controls to adequately address each of the defined security needs. 5.2.1 The repository shall maintain a systematic analysis of security risk factors associated with data, systems, personnel, and physical plant C3.1 Repository maintains a systematic analysis of such factors as data, systems, personnel, physical plant, and security needs. 221 Anexo 3: Tabela Comparativa da ISO 16363:2012 ISO 16363:2012 3 ORGANIZATIONAL INFRASTRUCTURE 3.1 GOVERNANCE AND ORGANIZATIONAL VIABILITY 3.1.1 The repository shall have a mission statement that reflects a commitment to the preservation of, long term retention of, management of, and access to digital information. 3.1.2 The repository shall have a Preservation Strategic Plan that defines the approach the repository will take in the long-term support of its mission. 3.1.2.1 The repository shall have an appropriate succession plan, contingency plans, and/or escrow arrangements in place in case the repository ceases to operate or the governing or funding institution substantially changes its scope. 3.1.2.2 The repository shall monitor its organizational environment to determine when to execute its succession plan, contingency plans, and/or escrow arrangements. TRAC NESTOR 1 NESTOR 2 AUDIT & CERTIFICATION CRITERIA> A. Organizational Infrastructure AUDIT & CERTIFICATION CRITERIA> A. Organizational Infrastructure> A1. Governance & organizational viability A1.1 Repository has a mission statement that reflects a commitment to the longterm retention of, management of, and access to digital information 1.2 The digital repository assumes responsibility for long-term preservation of the information represented by the digital objects. 1.2 The digital repository assumes responsibility for long-term preservation of the information represented by the digital objects 4.4 The digital repository engages in long-term planning [????] 8 The digital repository has a strategic plan for its technical preservation measures. 4.5 Continuation of the preservation tasks is ensured even beyond the existence of the digital repository. 4.4 The digital repository engages in long-term planning.[????] 8 The digital repository has a strategic plan for its technical preservation 4.5 Continuation of the preservation tasks is ensured even beyond the existence of the digital repository. 4.6 Continuation of the preservation tasks is ensured even beyond the existence of the digital repository A1.2. Repository has an appropriate, formal succession plan, contingency plans, and/or escrow arrangements in place in case the repository ceases to operate or the governing or funding institution substantially changes its scope. A4.5. Repository commits to monitoring for and bridging gaps in funding. [em parte] 4.6 Continuation of the preservation tasks is ensured even beyond the existence of the digital repository 223 ISO 16363:2012 3.1.3 The repository shall have a Collection Policy or other document that specifies the type of information it will preserve, retain, manage, and provide access to. 3.2 ORGANIZATIONAL STRUCTURE AND STAFFING 3.2.1 The repository shall have identified and established the duties that it needs to perform and shall have appointed staff with adequate skills and experience to fulfill these duties. 3.2.1.1 The repository shall have identified and established the duties that it needs to perform. 3.2.1.2 The repository shall have the appropriate number of staff to support all functions and services. 3.2.1.3 The repository shall have in place an active professional development program that provides staff with skills and expertise development opportunities. 3.3 PROCEDURAL ACCOUNTABILITY AND PRESERVATION POLICY FRAMEWORK 224 TRAC NESTOR 1 NESTOR 2 1.1 The digital repository has developed criteria for the selection of its digital objects. [???] 1.1 The digital repository has developed criteria for the selection of its digital objects [????] 4.3 Appropriate organisational structures exist for the digital repository. 5.1 All processes and responsibilities have been defined. 4.2 Sufficient numbers of appropriately qualified staff are available 4.3 Appropriate organisational structures exist for the digital repository. 5.1 All processes and responsibilities have been defined. 4.2 Sufficient numbers of appropriately qualified staff are available 4.3 Appropriate organisational structures exist for the digital repository. 5.1 All processes and responsibilities have been defined. 4.3 Appropriate organisational structures exist for the digital repository. 5.1 All processes and responsibilities have been defined. 4.2 Sufficient numbers of appropriately qualified staff are available 4.2 Sufficient numbers of appropriately qualified staff are available A2. Organizational structure & staffing A2.1. Repository has identified and established the duties that it needs to perform and has appointed staff with adequate skills and experience to fulfill these duties A2.2. Repository has the appropriate number of staff to support all functions and services. A2.1. Repository has identified and established the duties that it needs to perform and has appointed staff with adequate skills and experience to fulfill these duties A2.2. Repository has the appropriate number of staff to support all functions and services. A2.3. Repository has an active professional development program in place that provides staff with skills and expertise development opportunities. A3. Procedural accountability & policy framework ISO 16363:2012 3.3.1 The repository shall have defined its Designated Community and associated knowledge base(s) and shall have these definitions appropriately accessible. 3.3.2 The repository shall have Preservation Policies in place to ensure its Preservation Strategic Plan will be met. 3.3.2.1 The repository shall have mechanisms for review, update, and ongoing development of its Preservation Policies as the repository grows and as technology and community practice evolve. 3.3.3 The repository shall have a documented history of the changes to its operations, procedures, software, and hardware. 3.3.4 The repository shall commit to transparency and accountability in all actions supporting the operation and management of the repository that affect the preservation of digital content over time TRAC A3.1. Repository has defined its designated community(ies) and associated knowledge base(s) and has publicly accessible definitions and policies in place to dictate how its preservation service requirements will be met. NESTOR 1 NESTOR 2 1.3 The digital repository has defined its designated community(ies). 1.3 The digital repository has defined its designated community(ies). A3.2. Repository has procedures and policies in place, and mechanisms for their review, update, and development as the repository grows and as technology and community practice evolve. A3.6. Repository has a documented history of the changes to its operations, procedures, software, and hardware that, where appropriate, is linked to relevant preservation strategies and describes potential effects on preserving digital content. A3.7. Repository commits to transparency and accountability in all actions supporting the operation and management of the repository, especially those that affect the preservation of digital content over time. 225 ISO 16363:2012 TRAC 3.3.5 The repository shall define, collect, track, and appropriately provide its information integrity measurements. A3.8 Repository commits to defining, collecting, tracking, and providing, on demand, its information integrity measurements. A3.9 Repository commits to a regular schedule of self-assessment and certification and, if certified, commits to notifying certifying bodies of operational changes that will change or nullify its certification status. A4. Financial sustainability A4.1. Repository has short- and longterm business planning processes in place to sustain the repository over time. A4.3. Repository’s financial practices and procedures are transparent, compliant with relevant accounting standards and practices, and audited by third parties in accordance with territorial legal requirements. A4.4. Repository has ongoing commitment to analyze and report on risk, benefit, investment, and expenditure (including assets, licenses, and liabilities). A5. Contracts, Licenses and Liabilities 3.3.6 The repository shall commit to a regular schedule of self-assessment and external certification. 3.4 FINANCIAL SUSTAINABILITY 3.4.1 The repository shall have shortand long-term business planning processes in place to sustain the repository over time. 3.4.2 The repository shall have financial practices and procedures which are transparent, compliant with relevant accounting standards and practices, and audited by third parties in accordance with territorial legal requirements. 3.4.3 The repository shall have an ongoing commitment to analyze and report on financial risk, benefit, investment, and expenditure (including assets, licenses, and liabilities). 3.5 CONTRACTS, LICENSES, AND LIABILITIES 226 NESTOR 1 4.1 Adequate financing of the digital repository is secured. NESTOR 2 4.1 Adequate financing of the digital repository is secured ISO 16363:2012 TRAC 3.5.1 The repository shall have and maintain appropriate contracts or deposit agreements for digital materials that it manages, preserves, and/or to which it provides access. A5.1 If repository manages, preserves, and/or provides access to digital materials on behalf of another organization, it has and maintains appropriate contracts or deposit agreements. A5.2 Repository contracts or deposit agreements must specify and transfer all necessary preservation rights, and those rights transferred must be documented. 3.1 Legal contracts exist between producers and the digital repository. 3.1 Legal contracts exist between producers and the digital repository A5.3 Repository has specified all appropriate aspects of acquisition, maintenance, access, and withdrawal in written agreements with depositors and other relevant parties. A3.3. Repository maintains written policies that specify the nature of any legal permissions required to preserve digital content over time, and repository can demonstrate that these permissions have been acquired when needed.[????] B1.7. Repository can demonstrate when preservation responsibility is formally accepted for the contents of the submitted data objects (i.e., SIPs). A5.5 If repository ingests digital content with unclear ownership/rights, policies are in place to address liability and challenges to those rights 3.2 In carrying out its archiving tasks, the digital repository acts on the basis of legal rulings. 3.2 In carrying out its archiving tasks, the digital repository acts on the basis of legal arrangements 1.1 The digital repository has developed criteria for the selection of its digital objects. 1.1 The digital repository has developed criteria for the selection of its digital objects. 3.5.1.1 The repository shall have contracts or deposit agreements which specify and transfer all necessary preservation rights, and those rights transferred shall be documented. 3.5.1.2 The repository shall have specified all appropriate aspects of acquisition, maintenance, access, and withdrawal in written agreements with depositors and other relevant parties. 3.5.1.3 The repository shall have written policies that indicate when it accepts preservation responsibility for contents of each set of submitted data objects. 3.5.1.4 The repository shall have policies in place to address liability and challenges to ownership/rights. NESTOR 1 NESTOR 2 227 ISO 16363:2012 TRAC 3.5.2 The repository shall track and manage intellectual property rights and restrictions on use of repository content as required by deposit agreement, contract, or license. 4 DIGITAL OBJECT MANAGEMENT 4.1 INGEST: ACQUISITION OF CONTENT 4.1.1 The repository shall identify the Content Information and the Information Properties that the repository will preserve. 4.1.1.1 The repository shall have a procedure(s) for identifying those Information Properties that it will preserve. 4.1.1.2 The repository shall have a record of the Content Information and the Information Properties that it will preserve. 4.1.2 The repository shall clearly specify the information that needs to be associated with specific Content Information at the time of its deposit. 4.1.3 The repository shall have adequate specifications enabling recognition and parsing of the SIPs. 4.1.4 The repository shall have mechanisms to appropriately verify the identity of the Producer of all materials. A5.4 Repository tracks and manages intellectual property rights and restrictions on use of repository content as required by deposit agreement, contract, or license. B. Digital Object Management B.1 Ingest: acquisition of content B1.1. Repository identifies properties it will preserve for digital objects. 12.6 The DR acquires adequate metadata to record the corresponding usage rights and conditions. ???? 12.6 The DR acquires adequate metadata to record the corresponding usage rights and conditions. ???? 9.2 The digital repository identifies which characteristics of the digital objects are significant for information preservation. 9.2 The digital repository identifies which characteristics of the digital objects are significant for information preservation. B1.2. Repository clearly specifies the information that needs to be associated with digital material at the time of its deposit (i.e., SIP). 9.1 The digital repository specifies its transfer objects (Submission Information Packages, SIPs). 9.1 The digital repository specifies its transfer objects (Submission Information Packages, SIPs). B1.3. Repository has mechanisms to authenticate the source of all materials. 7.1 Ingest: the digital repository ensures the authenticity of the digital objects. 7.1 Ingest: the digital repository ensures the authenticity of the digital objects. 228 NESTOR 1 NESTOR 2 ISO 16363:2012 TRAC NESTOR 1 NESTOR 2 4.1.5 The repository shall have an ingest process which verifies each SIP for completeness and correctness. B1.4. Repository’s ingest process verifies each submitted object (i.e., SIP) for completeness and correctness as specified in B1.2. B1.5. Repository obtains sufficient physical control over the digital objects to preserve them (Ingest: content acquisition). B1.6. Repository provides producer/depositor with appropriate responses at predefined points during the ingest processes. B1.8. Repository has contemporaneous records of actions and administration processes that are relevant to preservation. B.2 Ingest: creation of the archivable package 6.1 Ingest: the digital repository ensures the integrity of the digital objects. 6.1 Ingest: the digital repository ensures the integrity of the digital objects 9.3 The digital repository has technical control of the digital objects in order to carry out long-term preservation measures. 9.3 The digital repository has technical control of the digital objects in order to carry out long-term preservation measures. B2.1. Repository has an identifiable, written definition for each AIP or class of information preserved by the repository. B2.2. Repository has a definition of each AIP (or class) that is adequate to fit longterm preservation needs. 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 10.1 The digital repository defines its archival objects (Archival Information Packages, AIPs). 4.1.6 The repository shall obtain sufficient control over the Digital Objects to preserve them. 4.1.7 The repository shall provide the producer/depositor with appropriate responses at agreed points during the ingest processes. 4.1.8 The repository shall have contemporaneous records of actions and administration processes that are relevant to content acquisition. 4.2 INGEST: CREATION OF THE AIP 4.2.1 The repository shall have for each AIP or class of AIPs preserved by the repository an associated definition that is adequate for parsing the AIP and fit for longterm preservation needs. 4.2.1.1 The repository shall be able to identify which definition applies to which AIP. 4.2.1.2 The repository shall have a definition of each AIP that is adequate for long-term preservation, enabling the identification and parsing of all the required components within that AIP. 229 ISO 16363:2012 4.2.2 The repository shall have a description of how AIPs are constructed from SIPs. 4.2.3 The repository shall document the final disposition of all SIPs. 4.2.3.1 The repository shall follow documented procedures if a SIP is not incorporated into an AIP or discarded and shall indicate why the SIP was not incorporated or discarded. 4.2.4 The repository shall have and use a convention that generates persistent, unique identifiers for all AIPs. 4.2.4.1 The repository shall uniquely identify each AIP within the repository. 4.2.4.1.1 The repository shall have unique identifiers. 4.2.4.1.2 The repository shall assign and maintain persistent identifiers of the AIP and its components so as to be unique within the context of the repository. 4.2.4.1.3 Documentation shall describe any processes used for changes to such identifiers. 230 TRAC B2.3. Repository has a description of how AIPs are constructed from SIPs B2.4. Repository can demonstrate that all submitted objects (i.e., SIPs) are either accepted as whole or part of an eventual archival object (i.e., AIP), or otherwise disposed of in a recorded fashion. [em parte] B2.5. Repository has and uses a naming convention that generates visible, persistent, unique identifiers for all archived objects (i.e., AIPs). B2.5. Repository has and uses a naming convention that generates visible, persistent, unique identifiers for all archived objects (i.e., AIPs). B2.5. Repository has and uses a naming convention that generates visible, persistent, unique identifiers for all archived objects (i.e., AIPs). B2.5. Repository has and uses a naming convention that generates visible, persistent, unique identifiers for all archived objects (i.e., AIPs). NESTOR 1 NESTOR 2 10.2 The digital repository takes care of transforming the transfer objects (SIPs) into archival objects (AIPs). 10.2 The digital repository takes care of transforming the transfer objects (SIPs) into archival objects (AIPs). 12.1 The digital repository uniquely and permanently identifies its objects and their relationships. 12.1 The digital repository uniquely and persistently identifies its objects and their relationships. 12.1 The digital repository uniquely and permanently identifies its objects and their relationships. 12.1 The digital repository uniquely and persistently identifies its objects and their relationships. 12.1 The digital repository uniquely and permanently identifies its objects and their relationships. 12.1 The digital repository uniquely and persistently identifies its objects and their relationships. 12.1 The digital repository uniquely and permanently identifies its objects and their relationships. 12.1 The digital repository uniquely and persistently identifies its objects and their relationships. ISO 16363:2012 4.2.4.1.4 The repository shall be able to provide a complete list of all such identifiers and do spot checks for duplications. 4.2.4.1.5 The system of identifiers shall be adequate to fit the repository’s current and foreseeable future requirements such as numbers of objects. 4.2.4.2 The repository shall have a system of reliable linking/resolution services in order to find the uniquely identified object, regardless of its physical location. 4.2.5 The repository shall have access to necessary tools and resources to provide authoritative Representation Information for all of the digital objects it contains. 4.2.5.1 The repository shall have tools or methods to identify the file type of all submitted Data Objects. TRAC B2.7. Repository demonstrates that it has access to necessary tools and resources to establish authoritative semantic or technical context of the digital objects it contains (i.e., access to appropriate international Representation Information and format registries). B2.8 Repository records/registers Representation Information (including formats) ingested. [???] NESTOR 1 12.3 The digital repository acquires adequate metadata for structural description of the digital objects. 12.5 The digital repository acquires adequate metadata for technical description of the digital objects. NESTOR 2 12.3 The digital repository acquires adequate metadata for structural description of the digital objects. 12.5 The digital repository acquires adequate metadata for technical description of the digital objects. 231 ISO 16363:2012 TRAC 4.2.5.2 The repository shall have tools or methods to determine what Representation Information is necessary to make each Data Object understandable to the Designated Community. 4.2.5.3 The repository shall have access to the requisite Representation Information. 4.2.5.4 The repository shall have tools or methods to ensure that the requisite Representation Information is persistently associated with the relevant Data Objects. 4.2.6 The repository shall have documented processes for acquiring Preservation Description Information (PDI) for its associated Content Information and acquire PDI in accordance with the documented processes. B2.8 Repository records/registers Representation Information (including formats) ingested. [???] 4.2.6.1 The repository shall have documented processes for acquiring PDI. B2.9 Repository acquires preservation metadata (i.e., PDI) for its associated Content Information. 232 B2.9 Repository acquires preservation metadata (i.e., PDI) for its associated Content Information. NESTOR 1 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. NESTOR 2 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. ISO 16363:2012 TRAC 4.2.6.2 The repository shall execute its documented processes for acquiring PDI. B2.9 Repository acquires preservation metadata (i.e., PDI) for its associated Content Information. 4.2.6.3 The repository shall ensure that the PDI is persistently associated with the relevant Content Information. B2.9 Repository acquires preservation metadata (i.e., PDI) for its associated Content Information. 4.2.7 The repository shall ensure that the Content Information of the AIPs is understandable for their Designated Community at the time of creation of the AIP. 4.2.7.1 Repository shall have a documented process for testing understandability for their Designated Communities of the Content Information of the AIPs at their creation. 4.2.7.2 The repository shall execute the testing process for each class of Content Information of the AIPs. B2.10 Repository has a documented process for testing understandability of the information content and bringing the information content up to the agreed level of understandability. B2.10 Repository has a documented process for testing understandability of the information content and bringing the information content up to the agreed level of understandability. B2.10 Repository has a documented process for testing understandability of the information content and bringing the information content up to the agreed level of understandability. NESTOR 1 NESTOR 2 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. 12.4 The digital repository acquires adequate metadata to record the changes made by the digital repository to the digital objects. 12.6 The digital repository acquires adequate metadata to record the corresponding usage rights and conditions. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 233 ISO 16363:2012 TRAC NESTOR 1 NESTOR 2 4.2.7.3 The repository shall bring the Content Information of the AIP up to the required level of understandability if it fails the understandability testing. B2.10 Repository has a documented process for testing understandability of the information content and bringing the information content up to the agreed level of understandability. B2.11 Repository verifies each AIP for completeness and correctness at the point it is generated B2.12 Repository provides an independent mechanism for audit of the integrity of the repository collection/content. B2.13 Repository has contemporaneous records of actions and administration processes that are relevant to preservation (AIP creation). B.3 Preservation Planning B3.1. Repository has documented preservation strategies 2.2 The digital repository ensures that the designated community can interpret the digital objects. 2.2 The digital repository ensures that the designated community can interpret the digital objects. 6.1 Ingest: the digital repository ensures the integrity of the digital objects. 6.1 Ingest: the digital repository ensures the integrity of the digital objects. 4.4 The digital repository engages in long-term planning. 8 The digital repository has a strategic plan for its technical preservation 4.4 The digital repository engages in long-term planning. 8 The digital repository has a strategic plan for its technical preservation 4.2.8 The repository shall verify each AIP for completeness and correctness at the point it is created. 4.2.9 The repository shall provide an independent mechanism for verifying the integrity of the repository collection/content. 4.2.10 The repository shall have contemporaneous records of actions and administration processes that are relevant to AIP creation. 4.3 PRESERVATION PLANNING 4.3.1 The repository shall have documented preservation strategies relevant to its holdings. 4.3.2 The repository shall have mechanisms in place for monitoring its preservation environment. 234 B3.2. Repository has mechanisms in place for monitoring and notification when Representation Information (including formats) approaches obsolescence or is no longer viable. B3.3 Repository has mechanisms to change its preservation plans as a result of its monitoring activities. ISO 16363:2012 TRAC 4.3.2.1 The repository shall have mechanisms in place for monitoring and notification when Representation Information is inadequate for the Designated Community to understand the data holdings. B3.2. Repository has mechanisms in place for monitoring and notification when Representation Information (including formats) approaches obsolescence or is no longer viable. 4.3.3 The repository shall have mechanisms to change its preservation plans as a result of its monitoring activities. 4.3.3.1 The repository shall have mechanisms for creating, identifying or gathering any extra Representation Information required. 4.3.4 The repository shall provide evidence of the effectiveness of its preservation activities 4.4 AIP PRESERVATION B3.3 Repository has mechanisms to change its preservation plans as a result of its monitoring activities. 4.4.1 The repository shall have specifications for how the AIPs are stored down to the bit level. 4.4.1.1 The repository shall preserve the Content Information of AIPs. B3.4. Repository can provide evidence of the effectiveness of its preservation planning B.4 Archival storage & preservation/ maintenance of AIPs B4.2. Repository implements/responds to strategies for archival object (i.e., AIP) storage and migration [????] B4.3 Repository preserves the Content Information of archival objects (i.e., AIPs). NESTOR 1 NESTOR 2 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 10.4 The digital repository implements strategies for the long-term preservation of the AIPs. 10.4 The digital repository implements strategies for the long-term preservation of the AIPs. 235 ISO 16363:2012 TRAC 4.4.1.2 The repository shall actively monitor the integrity of AIPs. B4.4 Repository actively monitors integrity of archival objects (i.e., AIPs). 4.4.2 The repository shall have contemporaneous records of actions and administration processes that are relevant to storage and preservation of the AIPs. 4.4.2.1 The repository shall have procedures for all actions taken on AIPs. B4.5 Repository has contemporaneous records of actions and administration processes that are relevant to preservation (Archival Storage). 4.4.2.2 The repository shall be able to demonstrate that any actions taken on AIPs were compliant with the specification of those actions. 4.5 INFORMATION MANAGEMENT 4.5.1 The repository shall specify minimum information requirements to enable the Designated Community to discover and identify material of interest. 4.5.2 The repository shall capture or create minimum descriptive information and ensure that it is associated with the AIP. 236 NESTOR 1 NESTOR 2 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 7.2 Archival Storage: the digital repository ensures the authenticity of the digital 10.3 The digital repository guarantees the storage and readability of the AIPs. 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 7.2 Archival Storage: the digital repository ensures the authenticity of the digital 10.3 The digital repository guarantees the storage and readability of the AIPs. 12.2 The digital repository acquires adequate metadata for formal and content- based description and identification of the digital objects. 12.2 The digital repository acquires adequate metadata for formal and content- based description and identification of the digital objects B.5 Information Management B5.1 Repository articulates minimum metadata requirements to enable the designated community to discover and identify material of interest. B5.2 Repository captures or creates minimum descriptive metadata and ensures that it is associated with the archived object (i.e., AIP). ISO 16363:2012 4.5.3 The repository shall maintain bidirectional linkage between each AIP and its descriptive information. 4.5.3.1 The repository shall maintain the associations between its AIPs and their descriptive information over time. 4.6 ACCESS MANAGEMENT 4.6.1 The repository shall comply with Access Policies. 4.6.1.1 The repository shall log and review all access management failures and anomalies. 4.6.2 The repository shall follow policies and procedures that enable the dissemination of digital objects that are traceable to the originals, with evidence supporting their authenticity. TRAC B5.3 Repository can demonstrate that referential integrity is created between all archived objects (i.e., AIPs) and associated descriptive information. B5.4 Repository can demonstrate that referential integrity is maintained between all archived objects (i.e., AIPs) and associated descriptive information. B.6 Access Management B6.1 Repository documents and communicates to its designated community(ies) what access and delivery options are available.[???] B6.5 Repository access management system fully implements access policy. B6.6 Repository logs all access management failures, and staff review inappropriate “access denial” incidents. B6.10 Repository enables the dissemination of authentic copies of the original or objects traceable to originals. NESTOR 1 NESTOR 2 12.7 The assignment of metadata to the digital objects is guaranteed at all times. 12.7 The package structure is preserved at all at all times 12.7 The assignment of metadata to the digital objects is guaranteed at all times. 12.7 The package structure is preserved at all at all times 2.1 The digital repository ensures its designated community can access the digital objects. 11.1 The digital repository defines its usage objects (Dissemination Information Packages, DIPs) 11.2 The digital repository ensures transformation of AIPs into DIPs. 6.3 Access: the digital repository ensures the integrity of the digital objects. 2.1 The digital repository ensures its designated community can access the digital objects. 11.1 The digital repository defines its usage objects (Dissemination Information Packages, DIPs) 11.2 The digital repository ensures transformation of AIPs into DIPs. 6.3 Access: the digital repository ensures the integrity of the digital objects. 7.3 Access: the digital repository ensures the authenticity of the digital objects. 7.3 Access: the digital repository ensures the authenticity of the digital objects. 237 ISO 16363:2012 TRAC 4.6.2.1 The repository shall record and act upon problem reports about errors in data or responses from users. B6.7 Repository can demonstrate that the process that generates the requested digital object(s) (i.e., DIP) is completed in relation to the request. B6.8 Repository can demonstrate that the process that generates the requested digital object(s) (i.e., DIP) is correct in relation to the request. B6.9 Repository demonstrates that all access requests result in a response of acceptance or rejection. 5 INFRASTRUCTURE AND SECURITY RISK MANAGEMENT 5.1 TECHNICAL INFRASTRUCTURE RISK MANAGEMENT C. Technologies, Technical Infrastructure & Security C1. System Infrastructure C.2 Appropriate technologies[???] 5.1.1 The repository shall identify and manage the risks to its preservation operations and goals associated with system infrastructure. C1.1 Repository functions on wellsupported operating systems and other core infrastructural software. 238 NESTOR 1 NESTOR 2 5.2 The digital repository documents all its elements based on a defined process. 13.1 The IT infrastructure implements the object management demands. 5.2 The digital repository documents all its elements based on a defined process. 13.1 The IT infrastructure implements the object management demands. ISO 16363:2012 TRAC 5.1.1.1 The repository shall employ technology watches or other technology monitoring notification systems. C2.1 Repository has hardware technologies appropriate to the services it provides to its designated communities and has procedures in place to receive and monitor notifications, and evaluate when hardware technology changes are needed. C2.2 Repository has software technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when software technology changes are needed. C2.1 Repository has hardware technologies appropriate to the services it provides to its designated communities and has procedures in place to receive and monitor notifications, and evaluate when hardware technology changes are needed. C2.1 Repository has hardware technologies appropriate to the services it provides to its designated communities and has procedures in place to receive and monitor notifications, and evaluate when hardware technology changes are needed. 5.1.1.1.1 The repository shall have hardware technologies appropriate to the services it provides to its designated communities. 5.1.1.1.2 The repository shall have procedures in place to monitor and receive notifications when hardware technology changes are needed. NESTOR 1 NESTOR 2 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 239 ISO 16363:2012 5.1.1.1.3 The repository shall have procedures in place to evaluate when changes are needed to current hardware. 5.1.1.1.4 The repository shall have procedures, commitment and funding to replace hardware when evaluation indicates the need to do so. 5.1.1.1.5 The repository shall have software technologies appropriate to the services it provides to its designated communities. 5.1.1.1.6 The repository shall have procedures in place to monitor and receive notifications when software changes are needed. 240 TRAC C2.1 Repository has hardware technologies appropriate to the services it provides to its designated communities and has procedures in place to receive and monitor notifications, and evaluate when hardware technology changes are needed. C2.1 Repository has hardware technologies appropriate to the services it provides to its designated communities and has procedures in place to receive and monitor notifications, and evaluate when hardware technology changes are needed.[????] C2.2 Repository has software technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when software technology changes are needed. C2.2 Repository has software technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when software technology changes are needed. NESTOR 1 NESTOR 2 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes ISO 16363:2012 TRAC 5.1.1.1.7 The repository shall have procedures in place to evaluate when changes are needed to current software. C2.2 Repository has software technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when software technology changes are needed. C2.2 Repository has software technologies appropriate to the services it provides to its designated community(ies) and has procedures in place to receive and monitor notifications, and evaluate when software technology changes are needed.[????] C1.2 Repository ensures that it has adequate hardware and software support for backup functionality sufficient for the repository’s services and for the data held, e.g., metadata associated with access controls, repository main content. C1.5 Repository has effective mechanisms to detect bit corruption or loss C1.6 Repository reports to its administration all incidents of data corruption or loss, and steps taken to repair/replace corrupt or lost data. 5.1.1.1.8 The repository shall have procedures, commitment, and funding to replace software when evaluation indicates the need to do so. 5.1.1.2 The repository shall have adequate hardware and software support for backup functionality sufficient for preserving the repository content and tracking repository functions. 5.1.1.3 The repository shall have effective mechanisms to detect bit corruption or loss. 5.1.1.3.1 The repository shall record and report to its administration all incidents of data corruption or loss, and steps shall be taken to repair/replace corrupt or lost data. NESTOR 1 NESTOR 2 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 6.2 Archival Storage: the digital repository ensures the integrity of the digital objects. 241 ISO 16363:2012 TRAC 5.1.1.4 The repository shall have a process to record and react to the availability of new security updates based on a risk-benefit assessment. 5.1.1.5 The repository shall have defined processes for storage media and/or hardware change (e.g., refreshing, migration). 5.1.1.6 The repository shall have identified and documented critical processes that affect its ability to comply with its mandatory responsibilities. 5.1.1.6.1 The repository shall have a documented change management process that identifies changes to critical processes that potentially affect the repository’s ability to comply with its mandatory responsibilities. 5.1.1.6.2 The repository shall have a process for testing and evaluating the effect of changes to the repository’s critical processes. 5.1.2 The repository shall manage the number and location of copies of all digital objects. 5.1.2.1 The repository shall have mechanisms in place to ensure any/multiple copies of digital objects are synchronized. 5.2 SECURITY RISK MANAGEMENT C1.10 Repository has a process to react to the availability of new software security updates based on a risk-benefit assessment C1.7 Repository has defined processes for storage media and/or hardware change (e.g., refreshing, migration). 242 C1.8 Repository has a documented change management process that identifies changes to critical processes that potentially affect the repository’s ability to comply with its mandatory responsibilities.. C1.9 Repository has a process for testing the effect of critical changes to the system. C1.3 Repository manages the number and location of copies of all digital objects C1.4 Repository has mechanisms in place toensure any/multiple copies of digital objects are synchronized. C.3 Security NESTOR 1 NESTOR 2 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes 5.3 The digital repository reacts to substantial changes 4.5 The digital repository reacts to substantial changes ISO 16363:2012 5.2.1 The repository shall maintain a systematic analysis of security risk factors associated with data, systems, personnel, and physical plant. 5.2.2 The repository shall have implemented controls to adequately address each of the defined security risks. 5.2.3 The repository staff shall have delineated roles, responsibilities, and authorizations related to implementing changes within the system. 5.2.4 The repository shall have suitable written disaster preparedness and recovery plan(s), including at least one off-site backup of all preserved information together with an offsite copy of the recovery plan(s). TRAC NESTOR 1 NESTOR 2 C3.1 Repository maintains a systematic analysis of such factors as data, systems, personnel, physical plant, and security needs. C3.2 Repository has implemented controls to adequately address each of the defined security needs 14 The infrastructure protects the digital repository and its digital objects. 14 The infrastructure protects the digital repository and its digital objects. 13.2 The IT infrastructure implements the security demands of the IT security system. 13.2 The IT infrastructure implements the security requirements of the IT security system C3.3 Repository staff have delineated roles, responsibilities, and authorizations related to implementing changes within the system C3.4 Repository has suitable written disaster preparedness and recovery plan(s), including at least one off-site backup of all preserved information together with an off- site copy of the recovery plan(s). 243