Jornalistas, pesquisadores, professores e estudantes de comunicação têm agora ao alcance do mouse milhões de páginas históricas da imprensa verde-amarela. A Biblioteca Nacional acaba de lançar oficialmente a Hemeroteca Digital Brasileira (http://migre.me/ayTh9), a HDB, que entrou na rede à mineira, sem alarde algum, no primeiro semestre. Seu acervo reúne, no momento, coleções de 652 publicações dos séculos 19 e 20, todas fora de circulação, entre as quais diversos títulos que marcaram época. Exemplos: Correio da Manhã; Correio Paulistano; as revistas Diretrizes (lançada durante o Estado Novo por Samuel Wainer) e Klaxon, principal veículo do Movimento Modernista; e o revolucionário Diário Carioca, o primeiro jornal do País a adotar o lead, o Português falado nas ruas e um manual de redação (mais informações, incluindo a íntegra do manual, podem ser obtidas em www.diariocarioca.com.br).
Ferramenta de busca
A HDB ainda terá de comer muita poeira até se aproximar dos líderes mundiais em sua seara, casos do Newspaper Archive, do Google News Archive e do British Newspapers Archive, com 120, 60 e 40 milhões de páginas escaneadas, respectivamente. Mas a novata promete dar o que falar, pois já superou o Chronicling America, da Biblioteca do Congresso dos Estados Unidos, que atingiu no fim do ano passado a marca de 4 milhões. “Colocamos à disposição dos internautas, até agora, pouco mais de 5 milhões de páginas. O próximo passo será ampliar essa oferta para 10 milhões até março de 2013, dotando a Biblioteca Nacional de um dos maiores acervos digitalizados de publicações extintas de todo o mundo”, informa Angela Monteiro Bettencourt, coordenadora da Biblioteca Nacional Digital e uma das principais artífices do desenvolvimento da Hemeroteca Digital Brasileira. “A ideia é que o nosso portal reúna o maior número possível de coleções digitalizadas de jornais e revistas existentes no País. Vamos procurar parcerias.”
O projeto decolou no primeiro semestre do ano passado com o aporte de R$ 6 milhões pelo Ministério da Ciência e Tecnologia e a Financiadora de Estudos e Projetos, a Finep. Os recursos bancaram a aquisição de um armazenador (storage) de 500 terabytes e dois scanners de última geração, capazes de processar 25 mil imagens microfilmadas por dia. A seguir, teve início a digitalização dos microfilmes, a cargo da Docpro, que presenteou a contratante com uma ferramenta de busca. “Apesar de toda a tecnologia de que dispomos, parte do trabalho tem de ser feita à mão, para garantir total qualidade. É o caso das capturas de imagens coloridas, que chegam a 500 diariamente”, assinala Angela.
Até o fim da manhã de sexta-feira (31/8), os campeões de audiência da HDB eram o Almanak Administrativo, Mercantil e Industrial do Rio de Janeiro (1844-1889), com 151.827 acessos, o Correio da Manhã (1901-1974), com 125.475 acessos (nos períodos de 1950 a 59 e 1960 a 69), o Diário do Rio de Janeiro (1821-1878), com 52.800 (1821-1858) e O Paiz (1884-1930), com 52.060 (1910-1919). Nos próximos meses, com a incorporação de cerca de 300 títulos ao cardápio, o quarteto ganhará um concorrente de peso na preferência dos plugados. Trata-se do Jornal do Brasil, que liberou a reprodução de seus exemplares sem custo algum. De início, serão digitalizadas as edições entre janeiro de 1950 e setembro de 2010, quando o JB trocou as bancas de vez pela web.
Milhões de imagens
“O Jornal do Brasil já tem parte da sua coleção disponível no Google News, mas o resultado deixou a desejar, pois, além de faltarem vários números, não é possível salvar imagens e o portal não dispõe de ferramenta de busca. Vamos suprir essas deficiências”, adianta a coordenadora da Biblioteca Nacional Digital, que enaltece a generosidade dos detentores do tradicional título. “Esperamos que o exemplo do JB faça escola.”
Em meados da década, os jornais e revistas pertencentes à Biblioteca Nacional serão transferidos do centenário prédio na avenida Rio Branco, no coração da Cinelândia carioca, para a Rodrigues Alves, na zona portuária do Rio de Janeiro. Lá, a nova Hemeroteca Brasileira, “mãe” da HDB, ganhará sede própria num antigo silo que será repaginado – a um custo de R$ 17,9 milhões, bancados pelo BNDES – para abrigar, entre outros itens, os 17 quilômetros de estantes onde são guardados os periódicos do acervo. A megacoleção inclui 30 milhões de imagens estampadas em 30 mil rolos de microfilmes, das quais “só” 10 milhões serão digitalizadas até março. O processamento dos dois terços restantes dependerá de patrocinadores. “Temos condições de digitalizar, tranquilamente, oito milhões de imagens por ano”, avisa Angela aos possíveis interessados.
***
[Dario Palhares é jornalista]