Descobriu-se que não é necessário ser-se cientista para codificar dados em ADN. Investigadores têm explorando o armazenamento de dados baseado em ADN há décadas, mas um novo método baseado em modelos inspirados nos processos químicos das nossas células é fácil o suficiente para ser praticado pelo público leigo. A técnica poderá abrir caminho para uma forma incomum, mas extremamente estável, de armazenar informações.
A ideia de armazenar dados em ADN foi proposta pela primeira vez na década de 1950 pelo físico Richard Feynman. O material genético possui densidade de armazenamento e durabilidade excecionais; um único grama de ADN pode armazenar um trilião de gigabytes de dados e manter as informações por milhares de anos. Décadas depois, uma equipa liderada por George Church, na Universidade de Harvard, colocou a ideia em prática, codificando um livro de 53.400 palavras.
O método inicial dependia da síntese de ADN, que consiste em montar sequências genéticas nucleotídeo por nucleotídeo, como missangas num fio. Usando os blocos construtivos A, T, C e G, era possível codificar informações. Contudo, o processo era caro, demorado e propenso a erros, produzindo apenas 1 bit (ou um oitavo de byte) por nucleotídeo adicionado à sequência. Fundamentalmente, o processo exigia habilidades especializadas para a sua execução.
O novo método, publicado na revista Nature na semana passada, é mais eficiente, armazenando 350 bits de cada vez ao codificar cadeias de ADN em paralelo. Em vez de montar cada cadeia de ADN manualmente, a equipa utiliza blocos pré-construídos com cerca de 20 nucleotídeos, codificando informações ao alterar alguns blocos e deixar outros inalterados. Long Qian, da Universidade de Pequim, e a sua equipa, inspiraram-se no facto de que as células compartilham o mesmo conjunto básico de genes, mas se comportam de maneira diferente em resposta a alterações químicas nas cadeias de ADN. “Todas as células do nosso corpo têm a mesma sequência genómica, mas a programação genética vem das modificações no ADN. Se a vida o pode fazer, nós também podemos”, explica Qian.
Qian e os seus colegas codificaram dados por meio de metilação, uma reação química que ativa ou desativa genes ao adicionar um composto de metilo—uma pequena molécula relacionada ao metano. Depois de encaixar os blocos nas suas posições específicas na cadeia de ADN, os investigadores escolhem os blocos a metilar, com a presença ou ausência da modificação representando os valores binários 0 ou 1. As informações podem depois ser decifradas usando sequenciadores de nanoporos para detetar se um bloco foi metilado. Em teoria, o novo método é simples o suficiente, para ser executado sem conhecimento detalhado de manipulação de ADN.
A capacidade de armazenamento de cada cadeia de ADN atinge um máximo de cerca de 70 bits. Para arquivos maiores, os investigadores dividiram os dados em várias cadeias identificadas por códigos de barras exclusivos, codificados nos blocos. Após isso, as cadeias foram lidas simultaneamente e sequenciadas de acordo com os seus códigos de barras. Com esta técnica, os investigadores codificaram a imagem de um tigre da dinastia de Han, ajustando o processo de codificação até que a imagem não apresentasse erros. O mesmo processo foi aplicado com sucesso em imagens mais complexas, como uma impressão foto realista de um panda.
Para testar a aplicabilidade prática do método, a equipa recrutou 60 estudantes de diversas áreas académicas, não apenas cientistas, para codificar textos à sua escolha. Os voluntários transcreveram as suas mensagens em código binário por meio de um servidor web. De seguida, com um kit enviado pela equipa, adicionaram enzimas em placas de 96 poços contendo os blocos de ADN, marcando quais seriam metilados. De seguida, a equipa passou as amostras por um sequenciador para criar a cadeia de ADN. Quando o computador recebeu a sequência, os investigadores executaram um algoritmo de descodificação e enviaram a mensagem restaurada para um servidor web para que os alunos a recuperassem com uma palavra-passe. As mensagens apresentaram uma taxa de erro de 1,4% nas letras, mas os erros foram corrigidos usando modelos de aprendizagem da linguagem.
Após um maior desenvolvimento, Qian acredita que esta tecnologia será útil para o armazenamento de longo prazo de informações arquivísticas, como registos médicos, relatórios financeiros ou dados científicos que não precisam de ser acedidos frequentemente.
O sucesso que o público leigo obteve com a técnica nos ensaios de codificação sugere que o armazenamento em ADN pode, eventualmente, tornar-se uma tecnologia prática. “Todos armazenam dados diariamente, então, para competir com as tecnologias tradicionais, os métodos baseados em ADN precisam de ser acessíveis ao público comum”, afirma Jeff Nivala, o codiretor do Laboratório de Sistemas de Informação Molecular da Universidade de Washington. “Embora esta ainda seja uma demonstração inicial de que se está a ir ao encontro do público leigo, penso que é bastante único o facto de o conseguirem fazer.”
O armazenamento em ADN ainda precisa de evoluir bastante para competir com os métodos tradicionais de armazenamento de dados. Segundo Nivala, o novo sistema é mais caro do que as técnicas tradicionais ou os métodos anteriores de síntese de ADN. No entanto, o processo de codificação pode tornar-se mais eficiente com a automatização em maior escala. Com o desenvolvimento futuro, o armazenamento em ADN, baseado em modelos, poderá tornar-se um método mais seguro para lidar com a procura crescente de dados.