Wednesday, 25 de December de 2024 ISSN 1519-7670 - Ano 24 - nº 1319

Estamos hipotecando nosso futuro ao Arquivo Internet

Todos nós somos atraídos pelos temas de agenda atual porque eles alteram a nossa maneira de ver as coisas. Existem, no entanto, assuntos que só vão afetar o nosso quotidiano daqui a alguns anos, mas estão sendo decididos hoje sem que a gente se dê conta. Quando percebermos já será tarde demais e, se for necessário corrigir algum erro, o custo será muito maior, na melhor das hipóteses.

A internet está criando o maior acervo de dados e informações já reunido na história da humanidade. Não se trata de um arquivo inerte, uma espécie de museu da informação, mas algo vivo que se altera sempre que alguém buscar algum dado. Não é só um lugar onde se guardam números, histórias e documentos. Sua principal e fundamental utilidade é alimentar o processo de criação de novos conhecimentos, a base sobre a qual se apoia a produção de inovações tecnológicas e sociais, o motor da economia digital.

Bem, tudo isto para conversar sobre o Internet Archive (Arquivo Internet) um projeto iniciado em 1996 por um visionário chamado Brewster Kahle (desculpem, mas o perfil dele está em inglês porque é o mais completo) e que está hoje no centro de uma polêmica sobre sua sobrevivência como iniciativa independente, descentralizada e diversificada. 

Provavelmente muitos leitores estarão se perguntando: o que é que eu tenho a ver com isso? A pergunta faz sentido porque todos nós temos que tomar decisões sobre o que vai acontecer amanhã, como lidar com o aumento do preço da gasolina ou o que fazer com a nossa poupança. Mas o arquivamento das nossas mensagens de correio eletrônico, transações bancárias ou de nossas preferências em matéria de buscas na web são parte de um megaprocessamento de dados que sinaliza tendências que influirão nas nossas decisões sobre consumo e comportamento.

O futuro do Arquivo Internet está sendo decidido hoje porque ele cresceu muito e vai crescer ainda mais com o fenômeno dos Grandes Dados e a Internet das Coisas. A estrutura que viabilizou, até agora, a existência do projeto do engenheiro Kahle enfrenta uma crise de crescimento que pode causar o seu desaparecimento como projeto isento de pressões econômicas e politicas.

O Arquivo Internet já não consegue mais quantificar o volume de dados que são acumulados por dia em toda a rede. Um número estimativo minimamente confiável é de 3,28 exabytes a cada 24 horas, o que equivale a 3,28 bilhões de gigabytes por dia ou quase cinco pilhas de CD-ROMs da altura da distância entre a Terra e a Lua.

É uma quantidade inimaginável de dados e informações que transforma a primeira biblioteca planetária, a Biblioteca de Alexandria, num grão de areia comparado ao que temos hoje em acervo documental. O Arquivo Internet foi criado por Kahle justamente para ser a versão 2.0 da biblioteca incendiada no Egito numa data imprecisa, possivelmente entre os anos 48 antes de Cristo e 640 depois de Cristo.

O crescimento vertiginoso do acervo do Arquivo Internet superou a capacidade das 32 universidades e instituições vinculadas ao projeto de administrar e gerenciar o armazenamento de dados. A solução que começou a ganhar adeptos foi a terceirização do processamento para organização Archive.It , vinculada ao Arquivo Internet.

O problema é que se a tendência se consolidar, o acervo planetário de informações ficará sob um controle centralizado – o que vai contra o princípio adotado por Brewster Kahle, para quem a descentralização e diversificação do armazenamento e acesso eram a condição indispensável para que o versão 2.0 da Biblioteca de Alexandria cumprisse a sua função de viabilizar a produção de conhecimento em todo o planeta.

A existência de um acervo mundial de dados e informações digitalizadas é condição obrigatória para que os pesquisadores de todo o mundo tenham acesso a dados que permitam recombinar conhecimentos para criar novos produtos, serviços, processos e teorias. O processo de inovação se expande em ritmo inédito na história da humanidade justamente porque dispõe de um manancial também inédito de dados para alimentar a criatividade humana, a principal matéria-prima da economia digital.

A tarefa de centralizar ou descentralizar o armazenamento e processamento dos dados e informações produzidos no planeta é uma decisão extremamente complexa, e suas consequências são tão relevantes que é extremamente arriscado deixá-la nas mãos de uma única organização, por mais idônea que seja. O sistema de buscas Google já controla boa parte desse acervo e o comercializa em benefício próprio.

Todos nós temos dezenas de problemas imediatos a resolver e só um número mínimo de leitores de jornal, telespectadores e internautas consegue achar alguns minutos para refletir sobre o uso futuro dos dados que nós estamos diariamente entregando ao Arquivo Internet. Trata-se do maior capital já transferido gratuitamente a uma empresa ou organização, em toda a história de humanidade. Um capital que alimentará as decisões planetárias nos próximos decênios e que definirá o nosso futuro, provavelmente sem que tenhamos a mínima participação.