Sunday, 22 de December de 2024 ISSN 1519-7670 - Ano 24 - nº 1319

Rumo a uma era digital obscura?

Nas poucas décadas que a humanidade leva imersa na era digital ela criou dados suficientes para encher a memória de tantos iPads que, empilhados, quase chegariam à Lua. O ritmo de criação de informação é tal que, segundo um estudo da corporação EMC e a consultora IDC, dobra a cada dois anos. Antes que a década acabe, existirão 44 zetabytes de dados (um ZB é igual a um trilhão de gigabytes) e a montanha de tablets terá ido e voltado ao satélite mais de três vezes. O paradoxal é que boa parte dessa informação se perderá para as gerações futuras.

O vice-presidente da Google e um dos pais da internet, Vinton Cerf, alertou em uma conferência da Associação Norte-Americana para o Avanço da Ciência dias atrás sobre o perigo de que o criado por esta geração quase não deixe vestígios. Na crença de sua eternidade, o homo digitalis já não imprime fotos, as guarda em formato digital, não escreve cartas, mas as envia por e-mail, não armazena discos, arquiva as canções em nuvem. Uma parte cada vez maior de sua vida se desenvolve na rede: joga online, publica selfies no Facebook e compartilha suas paixões no Twitter. Mas o digital não é tão eterno.

A deterioração dos suportes nos quais a informação é armazenada, o desaparecimento dos programas para interpretá-la ou as limitações impostas pelo copyright a deixará inacessível para os humanos do futuro. De fato, não será necessário sequer esperar que os arqueólogos do futuro descubram que, como disse Cerf ao Financial Times, o começo do século XXI é “um buraco negro de informação”. Os primeiros efeitos dos que os anglo-saxões chamam de era digital obscura já estão sendo notados.

O caso dos disquetes exemplifica o problema colocado pelo vice-presidente da Google em toda sua complexidade. Foram o sistema de armazenamento básico nos anos oitenta. Neles cabiam tanto as fotos familiares como o trabalho escolar ou os documentos do trabalho. A maior parte dessa informação já se perdeu. E se ainda resta algum disquete, é quando os problemas começam de verdade: será necessário encontrar um drive que o leia, rezar para que os dados não tenham sido danificados com o passar do tempo para, provavelmente, descobrir que o programa para abrir o arquivo não existe há anos.

“Guardo disquetes velhos de 3,5 polegadas que alojam arquivos de texto escritos com um programa que já não existe e que funcionava com um Macintosh de 1986”, diz o consultor tecnológico Terry Kuny. Esse arquivista digital canadense foi o primeiro a falar deste tempo como uma possível era digital obscura há quase 20 anos. “Que opções eu, ou qualquer um, tem para acessar esses dados hoje? Mesmo se eu conseguir um drive velho, conseguir o sistema operacional e os programas não seria nada fácil. E se não existir alguém para dizer a quem tentar o que está dentro desses discos e em qual formato, o problema seria enorme”, acrescenta.

Em 1997, quando a atual era digital estava apenas começando, quando os computadores pessoais só estavam ao alcance dos mais abastados e a internet era para uma casta, quando ainda não existia o Google e muito menos o Facebook ou o Twitter, e a Microsoft dominava o mundo com seu Windows 95, Kuny, então assessor da Biblioteca Nacional do Canadá, deu uma palestra para a Federação Internacional de Associações de Bibliotecas. Seu título era premonitório: ”Uma era digital obscura? Desafios para a conservação da informação eletrônica“. A visão de Kuny, como a atual de Cerf, estão mais em voga do que nunca.

“Não acredito que exista um risco de que a informação de nosso tempo fique inacessível, acredito que é uma certeza. Já está acontecendo, a cada dia, em todo tipo de organização, para todas as classes de dados”, afirma Kuny. De fato, ele acredita que tudo o relacionado com a conservação digital vai de mal a pior. “Existe muito mais informação nascida digital do que antes e existem apenas poucas instituições públicas ou privadas que estejam ativamente implicadas em lidar com esse problema”.

Inimigos da memória digital

O primeiro desafio tem a ver com a física. Qualquer um com idade para ter visto fitas VHS com a gravação de seu casamento sabe da deterioração dos suportes nos quais os dados são armazenados. A gravação magnética da informação foi a dominante nas primeiras décadas da era digital. Ainda hoje, os discos rígidos guardam os dados utilizando a polaridade das partículas e, por conta do magnetismo, os dados acabam se perdendo.

Se aconteceu com a NASA, por que não aconteceria com o vídeo do casamento? A agência espacial norte-americana viu como boa parte das imagens feitas pelas sondas da Missão Viking enviadas à Marte nos anos setenta eram irrecuperáveis. Ainda que a NASA tenha transferido os dados das fitas magnéticas originais a suportes óticos, até 20% do material não pôde ser recuperado.

O caso das sondas Viking ilustra outro dos perigos de que esse tempo se transforme em uma idade digital obscura. Foi possível salvar 80% da informação enviada de Marte, mas foi guardada em um formato e com programas que já não existem. Só recentemente uma empresa canadense voltou a extrair as imagens. Existem formatos que parecem que vão durar a vida inteira e depois dela. É o caso das imagens guardadas no formato JPEG ou música em mp3. Mas e se aparecer um novo formato melhor e os anteriores caírem em desuso?

E confiar a preservação dos dados à boa fé das empresas que os criam tem seus perigos. Como a Fundação Fronteiras Eletrônicas (EFF, na sigla em inglês) denunciou mês passado, gigantes dos jogos como a Eletronic Arts fecham os servidores para jogar online em apenas um ano e meio se o jogo não tiver o sucesso esperado. Só em 2014, a indústria abandonou 65 jogos. Mas, ao mesmo tempo, as leis de copyright impedem que os jogadores mantenham seus próprios servidores.

Mas o maior risco de que a informação deste tempo desapareça no futuro está na Internet. Como mostra o estudo da IDC sobre o universo digital de 2014, a maior parte dos dados são alocados na rede. Dos milhões de selfies até cada minuto de vídeo carregado no YouTube, passando pelos comentários no Facebook, cada vez mais, a maior parte da vida de uma pessoa se encontra em algum servidor de alguma empresa e não em seu álbum familiar de fotografias.

Supomos que a Google ou o Facebook não vão acabar amanhã. Até mesmo quando encerram algum serviço, como fez o buscador com o Wave, dão um tempo razoável para que seus usuários descarreguem tudo o que tinham ali. A Google, por exemplo, conta com o Takeout, um sistema simples para fazer uma cópia de todos os dados criados e alocados em seus serviços. Mas nem sempre é assim.

No começo da década passada, existia uma rede social muito mais importante e conhecida do que o Facebook. Ela se chamava Friendster e em seu auge chegou a ter 100 milhões de usuários. Erros próprios e a popularidade de outras alternativas, entretanto, fizeram o Friendster afundar e, com ele, todas as histórias, conversas, amores e momentos compartilhados por seus usuários. Hoje, a empresa sobrevive como plataforma de jogos no sudeste asiático.

“Tivemos muita sorte da Internet Archive reagir a tempo e obter uma cópia de toda a informação pública no Friendster poucos antes dele ser desativado”, comenta o especialista em redes sociais da Escola Técnica Federal de Zurique (ETH), o espanhol David García. A relevância que as redes sociais têm na vida de hoje as transformou para os cientistas sociais em ferramentas fundamentais para estudar as sociedades humanas. Essa cópia, por exemplo, serviu para que García e outros pesquisadores estudassem fenômenos sociais que afetam a privacidade.

Um desses pesquisadores sociais é Alan Mislove, da Universidade Northeastern (EUA). Mislove estudou o Twitter a fundo. Em um artigo publicado ano passado, comprovou que quase 20% dos tweets publicados nesta rede social desapareceram. “É difícil projetar o que acontecerá futuramente com os tweets perdidos”, esclarece. Para Mislove, “os dados de sites como o Twitter e o Facebook oferecem aos pesquisadores uma capacidade sem precedentes para estudar a sociedade a uma escala e detalhamento que eram simplesmente impossíveis antes”.

Luzes contra a idade digital obscura

Se existem tantos riscos, o que está sendo feito para enfrentá-los? As soluções são tanto tecnológicas como organizacionais e até legislativas. O mais urgente parece ser o problema da longevidade dos dados, como conservá-los para os que vierem depois.

As tecnologias de armazenamento não variaram muito em todo esse tempo. A informação é gravada em suportes magnéticos ou, com a ajuda do laser, em discos óticos. Mesmo que o DVD ou o Blu-ray pareçam as melhores alternativas, o futuro continuará sendo magnético.

“No ano passado, a IBM e a Fujifilm conseguiram uma densidade de armazenamento sobre fita de 85,9 gigabytes por polegada quadrada, o que permitiu uma capacidade de 154 terabytes [um terabyte são 1.000 gigabytes] em um cartucho que cabe na palma da mão. Isto é o texto de 154 milhões de livros”, lembra o responsável em tecnologias avançadas de fita da IBM Research, Mark Lantz.

Talvez pela IBM ser a única empresa de tecnologia com mais de um século de vida, sabe da importância da preservação dos dados. Para Lantz, a fita magnética não está morta, longe disso. “Em nosso laboratório em Zurique estamos trabalhando em uma tecnologia de fita para a preservação dos dados a longo prazo”, afirma. Com a manutenção e conservação adequadas, a gravação em suportes magnéticos mantém a informação intacta durante décadas.

Outra questão é a de poder reproduzi-las como passar do tempo. Esse é o maior temor expressado por Vinton Cerf em sua palestra. Sem as ferramentas adequadas para contextualizar os dados, eles seriam ilegíveis mesmo estando conservados. Cerf mencionou como solução um projeto no qual a IBM também participa. O gigante da informática, junto com a universidade Carnegie Mellon criaram o projeto Olive. Seu objetivo é criar uma espécie de imagem que inclua tudo, os dados do arquivo, o programa com o qual foi criado e até o código. Por meio de máquinas virtuais, o conteúdo poderá ser executado em qualquer sistema que aparecer no futuro.

Iniciativas como essa podem ser ajudadas pelo que a EFF está pedindo às autoridades dos EUA: que na legislação sobre copyright seja incluída uma exceção que obrigue as empresas que criaram um programa ou um jogo a liberar seu código quando o abandonarem ou, pelo menos, permitir sua obtenção mediante engenharia reversa.

Mas o maior desafio é conservar toda a informação acumulada em algo tão grande e dinâmico como é a rede. A Internet Archive é a maior tentativa que existe para conservar a memória da rede. Os robôs dessa organização rastreiam periodicamente a rede fazendo cópias das páginas que encontra e as guardando. Assim, se alguma página desaparece, sempre existirá a possibilidade de relembrar como era.

Na Espanha, há anos a Biblioteca Nacional vem fazendo o mesmo com a ajuda da Internet Archive. Mas o ano passado foi o primeiro em que, com seu próprio robô, começaram a escanear a rede espanhola. Já copiaram 140 terabytes entre recursos, páginas da rede, blogs… A BNE, entretanto, está à espera da aprovação de um regulamento sobre o depósito legal de publicações eletrônicas que a permita conservar tudo o que a tecnologia permitir da Internet em espanhol.

Mas evitar que esta seja uma idade digital obscura é função de cada um. “Todos nós devemos nos transformar em nossos próprios bibliotecários. Cada um deve ser o responsável por sua vida digital. Não podemos salvá-la inteira e as coisas que decidirmos salvar, deveremos fazê-lo com cuidado”, alerta Terry Kuny, que já o faz há 20 anos, bem antes de Vinton Cerf.

******

Miguel Ángel Criado, do El País