A digitalização pode ajudar a conter a maré de entropia, mas não vai pará-la.
Tudo morre: pessoas, máquinas, civilizações. Talvez possamos encontrar algum consolo em saber que todas as coisas significativas que aprendemos ao longo da vida irão sobreviver. Mas mesmo o conhecimento tem uma data de validade. Os documentos desaparecem. A arte desvanece. Bibliotecas e coleções inteiras podem encarar uma destruição rápida e inesperada.
Certamente, vivemos um estágio onde tecnologicamente podemos inventar maneiras de fazer com que o conhecimento esteja disponível e seja acessível para sempre. Afinal, a densidade do armazenamento de dados já é incompreensivelmente alta. No crescente museu da internet, pode-se facilmente passar de imagens do Telescópio Espacial James Webb para diagramas explicando a filosofia de Pitágoras sobre a música das esferas, ou até um tutorial do YouTube sobre solos de guitarra de blues. O que mais poderia querer?
Muita coisa, de acordo com os especialistas. Por um lado, o que pensamos que é permanente não o é de facto. Os sistemas de armazenamento digital podem tornar-se ilegíveis em menos de três a cinco anos. Bibliotecários e arquivistas correm contra o tempo para copiar as coisas para formatos mais novos. Mas a entropia está sempre lá, à espreita. “As nossas profissões e a nossa sociedade muitas vezes tentam estender o tempo de vida normal o máximo possível por meio de uma variedade de técnicas, numa manobra para tentar atrasar a maré [de entropia]”, diz Joseph Janes, professor associado da Escola de Informação da Universidade de Washington, Estados Unidos.
Para complicar a situação ainda mais, os arquivistas se deparam com uma enxurrada de informações sem precedentes. No passado, os materiais eram escassos e o espaço de armazenamento limitado. “Agora temos o problema oposto”, diz Janes. “Tudo é gravado o tempo todo.”
Em tese, isso poderia corrigir um erro histórico. Durante séculos, inúmeras pessoas não tiveram o que se supunha ser a cultura, o género ou a classe socioeconómica certa para que os seus conhecimentos ou trabalhos fossem descobertos, valorizados ou preservados. Mas a escala massiva do mundo digital de hoje apresenta um desafio único. De acordo com uma estimativa do ano passado da empresa de pesquisa de mercado, a International Data Corporation (IDC), a quantidade de dados que empresas, governos e indivíduos criarão nos próximos anos será o dobro do total de todos os dados digitais gerados anteriormente desde o início da era da computação.
Centros de ensinos dentro de algumas universidades estão a trabalhar para encontrar melhores técnicas para gravar e salvar os dados sob os seus cuidados. O Centro de Dados e Serviços para Humanidades da Universidade de Basel, na Suíça, por exemplo, vem a desenvolver uma plataforma de software chamada Knora para não apenas arquivar os muitos tipos de dados gerados nos seus trabalhos, mas também para garantir que as pessoas no futuro possam ter acesso aos mesmos. No entanto, o processo é difícil.
“Não podemos salvar tudo, mas isso não é motivo para não fazer o que podemos.” Andrea Ogier
“Fazemos suposições e esperamos pelo melhor, mas há conjuntos de dados que se perdem porque ninguém imaginou que seriam úteis”, diz Andrea Ogier, vice-reitor e diretor de serviços de dados das Bibliotecas da Universidade de Virginia Tech, nos Estados Unidos.
Nunca há pessoas ou dinheiro suficientes para fazer todo o trabalho necessário. Além disso, os formatos mudam e multiplicam-se o tempo todo. “Como melhor distribuir os recursos para preservar as coisas? Afinal, os orçamentos são limitados”, diz Janes. “Em alguns casos, isso significa que as coisas são salvas ou armazenadas, mas ficam lá, não catalogadas ou processadas e, portanto, quase impossíveis de encontrar ou acessar”. Em alguns casos, os arquivistas acabam por rejeitar novas coleções por conta da quantidade de materiais.
Os formatos usados para armazenar dados são transitórios. A NASA, por exemplo, guardou cerca de 170 fitas de dados sobre poeira lunar, recolhidas durante a era Apollo. Quando os investigadores quiseram usar as fitas em meados da década de 2000, não conseguiram encontrar ninguém com a máquina IBM 729 Mark 5 da década de 1960 necessária para ler os materiais. Com ajuda, a equipa acabou por encontrar um aparelho defeituoso no armazém do Museu Australiano de Computadores. Alguns voluntários ajudaram a reformar a máquina.
Softwares também têm uma data de validade. Ogier se lembra de ter tentado examinar uma antiga folha de cálculo do programa Quattro Pro apenas para descobrir que não havia nenhum software de fácil acesso capaz de abri-la.
Houve tentativas de programas resistentes ao futuro. Um projeto que recebeu muita atenção em 2015 foi o arquivo Open Library of Images for Virtualized Execution (Olive), capaz de rodar software antigo num conjunto de máquinas virtuais como o Chaste 3.1, um programa de pesquisa de biologia e fisiologia de 2013, e a versão para Mac de 1990 do jogo de computador The Oregon Trail. O projeto ainda está ativo, diz Mahadev Satyanarayanan, professor de ciência da computação da Carnegie Mellon University (EUA), mas tem havido desafios na sua expansão. Mesmo softwares não utilizados precisam ser licenciados pelas empresas proprietárias, e muitas vezes não há uma maneira fácil de inserir novos dados em aplicações de pesquisa do arquivo.
Outros esforços para ajudar a aumentar a longevidade do conhecimento também tiveram resultados mistos. O Internet Archive, lar do Wayback Machine, possui uma grande coleção de materiais digitalizados, incluindo software, música e vídeos, mas desde junho de 2022, tem estado a lutar contra uma ação de violação de direitos autorais movida por vários editores.
Pelo lado positivo, a Text Encoding Initiative (TEI) mantém padrões internacionais para codificar textos legíveis por máquina desde a década de 1990. Há uma década, o Escritório de Políticas Científicas e Tecnológicas (OSTP, sigla em inglês) dos EUA determinou que as pesquisas com apoio federal devem elaborar um plano de gestão de dados para que os dados possam ser usados por investigadores ou pelo público no futuro. “Estamos a chegar ao ponto em que quase todos os projetos de pesquisa financiados por doações precisam colocar os seus dados em algum lugar”, diz Ogier. Mas não há requisitos gerais sobre quem deve armazenar os dados ou por quanto tempo eles devem ser salvos.
Inevitavelmente, ideias, conhecimentos e criações humanas continuarão a se perder. “Não podemos salvar tudo. Não podemos fornecer acesso a tudo. Não podemos recuperar tudo”, diz Ogier. “Mas isso não é motivo para não fazermos o que podemos”.
Erik Sherman é um jornalista freelance em Ashfield, Massachusetts, EUA.