‘Que a internet é grande e continua crescendo a cada dia ninguém duvida. Mas a simples tentativa de mensurar o seu tamanho provoca polêmicas e muita troca de farpas, como a que colocou em cantos opostos do ringue dois sérios pretendentes ao cobiçado cargo de síndico do mundo virtual. Google ou Yahoo? Yahoo ou Google? Quem está mais perto de representar esse papel?
Até o início do mês, a voz corrente colocava o Google, a empresa de US$ 4 bilhões, pródiga em inovações e cada vez mais agressiva quando se trata de expandir os seus domínios pela web, como o maior de todos os serviços de buscas, com capacidade para vasculhar respostas em frações de segundos em 8,1 milhões de documentos indexados em sua base de dados.
Mas o Yahoo parece ter cansado de aparecer sempre em segundo plano e de uma hora para outra anunciou a presença de 19,2 bilhões de itens (textos, áudio, fotos e vídeos) em seu banco de dados e reivindicou o primeiro lugar no mercado. O pessoal do Google reclamou de uma suposta dupla contagem por parte do seu adversário direto, mas o Yahoo encarou a crítica como choro de quem perdeu a liderança na bilionária batalha por verbas publicitárias.
Pode até ser verdade, mas não é tão simples assim. Poucos sabem, mas nem tudo o que está na internet existe. Foi criado, continua a ser indexado, mas não existe mais, embora permaneça lá, mesmo que nas últimas páginas das respostas oferecidas pelas ferramentas de busca. Os Estados Unidos, por exemplo, respondem por dois em cada três bytes que trafegam na rede mãe, com 35,6 milhões de endereços, dos quais apenas 6 milhões realmente válidos. Os demais, a fantástica cifra de 29,6 milhões de sites, foram desativados ao longo dos anos e são agora oferecidos a preço de banana (www.deleteddomains.com).
Contar páginas ou sites ajudam, mas definitivamente não é um bom indicativo para medir o avanço da internet. Existem outros instrumentos para isso, como a contagem de hosts, as máquinas que fazem a ligação de computadores pessoais à internet. No mês passado, de acordo com o Network Wizards 2005 (www.isc.org/ds), 353 milhões de hospedeiros formavam a internet, um crescimento de 24% em comparação com o mesmo mês do ano passado. Por este quesito, o Brasil ocupa um honroso 9º lugar, com 4,4 milhões de hosts, já se aproximando do Reino Unido, com 4,7 milhões.
Por esse sistema é possível medir a expansão do ciberespaço, mas é impossível contar o número de pessoas ou endereços existentes na internet. Quem mais se aproxima dessa dura missão é a Netcraft, que há dez anos se preocupa em contar o números de endereços existentes na web. Na segunda-feira, as estatísticas da Netcraft apontavam a presença de 70,4 milhões de endereços, um aumento de 2,8 milhões de sites em relação ao mês passado, a maior taxa desde o início do levantamento.
Se alguém se der o trabalho de fazer as contas verá que, por esse critério, a média de crescimento da web é de um site a cada segundo, índice diretamente relacionado à expansão da chamada blogosfera, a área da internet dedicada aos blogs. Levantamento realizado pela Technorati identificou a presença de 14,2 milhões de blogs em agosto, um número que já representa 20% do mundo digital mensurável pelas estatísticas.
Curiosamente, o crescimento do número de blogs se dá à taxa média de um endereço por segundo, exatamente a mesma da internet como um todo. Pode até não ajudar a responder à pergunta feita lá em cima, mas serve como indício que talvez esteja aí o principal motivo para a grande diferença entre os números apresentados por Google e Yahoo.
LENHA NA FOGUEIRA
A pedido do jornal The New York Times, pesquisadores do Centro Nacional para Aplicações de Supercomputadores realizaram uma série de testes para tentar descobrir quem é o maior, Google ou Yahoo, no quesito indexação de páginas na internet. Partindo de uma amostra de mais de 10 mil buscas aleatórias, os pesquisadores concluíram que o Google apresentou desempenho melhor do que o seu concorrente direto.
Outros dois pesquisadores italianos também entraram na disputa. Após uma série de cálculos, eles chegaram à conclusão de que ambas as ferramentas superestimam seus resultados. O estudo, disponível em www.www2005.org/cdrom/docs/p902.pdf calcula em 11,5 bilhões o número de documentos realmente indexáveis na internet, sejam textos, fotos ou vídeos.
O estudo, diga-se de passagem, foi realizado antes que viesse a público as escaramuças dos dois maiores buscadores da internet e está sendo utilizado para defender a criação de uma superferramenta de buscas com código inteiramente aberto. O superbuscador, por sinal, já tem nome: vai chamar-se Helios e terá capacidade para indexar 18 entre as maiores ferramentas de buscas existentes dentro ou fora da internet, incluindo, é claro, Yahoo e Google. Atualmente, o metabuscador mais possante do mercado é o MetaCrawler (www.metacrawler.com), um serviço que indexa 14 serviços diferentes de busca, mas que está longe de se um campeão de audiência ou popularidade.’
Juliano Barreto
‘Buscador Google só alcança 1% da internet ‘, copyright Folha de S. Paulo, 31/08/05
‘Considerado um oráculo dos tempos modernos, o Google (www.google.com.br) ganhou fama por ser supostamente capaz de encontrar qualquer página da internet em poucos segundos. A velocidade do site é realmente notável, mas especialistas afirmam que sua área de pesquisas é restrita a aproximadamente 1% do total de arquivos da rede.
Além de sites comuns, a internet abriga arquivos de áudio e de vídeo, imagens, bancos de dados, sites com acesso restrito e diversos tipos de servidor.
No total, de acordo com números da empresa Connotate Tecnologies (www.connotate.com), existem cerca de 600 bilhões de arquivos na rede, mas o Google acessa apenas cerca de 8 bilhões.
Para acessar essa outra camada de informação, que também é chamada de internet profunda ou invisível, é preciso contratar os serviços de empresas especializadas ou então se valer de buscadores dedicados a um tema específico, que podem exibir resultados mais precisos do que os sites de busca generalistas, como o Google ou o Yahoo!.
Uma terceira opção é usar comandos especiais nos portais para tentar filtrar os resultados.
Há também engenhos, como o Turbo10.com, que acessam listas de bancos de dados externos e permitem encontrar sites ignorados pelos outros buscadores.
De uso gratuito, o Turbo10 também pode ser personalizado pelos usuários. É possível adicionar fontes de informação ao engenho e refinar ainda mais as pesquisas na internet.
Os resultados obtidos com cada tipo de técnica, entretanto, são díspares e ainda não conseguem satisfazer todos os usuários. Grande parte dos sites que usam as novas tecnologias segue em caráter experimental (beta) e se destina a aplicações específicas, como encontrar documentos de instituições de ensino ou de empresas privadas.
Questão de Estado
As tecnologias para exploração das profundezas da internet são consideradas ferramentas importantes para o governo dos EUA.
Prova disso é a participação de órgãos governamentais em projetos que visam filtrar dados presentes nas camadas menos acessíveis da rede.
A Connotate Tecnologies desenvolve um serviço de busca em parceria com o Departamento de Defesa dos EUA e usa uma programação especial para obter mais arquivos de cada endereço pesquisado. ‘Nosso produto é um complemento aos sites de busca e não usa um índice de páginas. O usuário informa um endereço e um código especial extrai as informações’, diz o vice-presidente da Connotate, Dan Haughton.
Para que as buscas do mecanismo fiquem mais eficientes, programas chamados information agents (agentes de informação) monitoram e filtram os tipos de dados encontrados na localização informada pelo usuário.
Outra iniciativa para exploração da Deep Web é o projeto Aquaint (www.ic-arda.org/InfoExploit/aquaint/index.html), que é desenvolvido por um grupo formado por empresas, por universidades e pela CIA (agência de inteligência dos EUA). A base do Aquaint é um sistema capaz de relacionar dados no formato de perguntas e de respostas chamado de Q.A (questions and answers, em inglês).
Além de extrair informações de fontes da internet, o Aquaint poderia monitorar e converter o conteúdo exibido na televisão e nas estações de rádio em uma única base de dados.
Apesar do intuito de melhorar as pesquisas de civis, o potencial de um sistema capaz de varrer bancos de dados privados poderia ser usado para a espionagem.
Em teoria, um engenho que acessa sites restritos poderia buscar informações armazenadas em contas de webmail e em outras páginas com conteúdo protegido.’
***
‘Site temático traz resultados úteis’, copyright Folha de S. Paulo, 31/08/05
‘Quem é fã de cinema provavelmente já visitou o Internet Movie Data Base (www.imdb.com).
O site possui um banco de dados com elencos, fichas técnicas e sinopses de milhares de obras e se descreve como o maior banco de dados on-line sobre cinema.
O IMDB é um buscador vertical. Ele é especializado em um assunto e usa um engenho de pesquisas para facilitar a vida de seus usuários. Mas o cinema não é o único tema que conta com uma ferramenta desse tipo.
Existem buscadores dedicados aos mais diversos assuntos e eles muitas vezes são mais eficientes do que os portais de pesquisa mais famosos.
Apesar de mostrar menos resultados, eles trazem links mais relevantes para o usuário.
Um bom exemplo são os portais dedicados aos arquivos da rede BitTorrent. Enquanto Google, Yahoo! e MSN exibem links para outros sites, os buscadores especializados levam o internauta diretamente ao download.
Documentos educativos também ficam mais fáceis de serem encontrados e baixados com a ajuda dos buscadores verticais.
Sites nacionais e estrangeiros já se especializaram nesse tipo de assunto e até o Google lançou uma ferramenta temática, o Google Scholar (scholar.google.com).
A exemplo do que ocorre com outros pesquisadores específicos, o Scholar mostra menos resultados do que o Google.com. Por outro lado, suas indicações são mais relevantes.
Numa busca por textos explicativos sobre a linguagem de programação Java, o Scholar exibiu 593 mil resultados, enquanto o buscador tradicional mostrou 183 milhões de resultados.
Outras redes
Apesar da popularidade dos sites da World Wide Web, a rede mundial também é formada por sites FTP, comunidades da Usenet e outros serviços que guardam dados on-line, mas são ignorados pelos buscadores.
Descobrir o conteúdo que essa parte da rede abriga é fácil. No endereço www.ftpsearchengines.com, existem mais de 20 opções de buscadores especializados em sites FTP. Para buscar textos da Usenet é possível usar mecanismos como o Cyberfiber.com, o BinCrawler.com e o NetNews Tracker.com.’
SBT
Keila Jimenez
‘SBT sacode sua programação ‘, copyright O Estado de S. Paulo, 30/08/05
‘A reclamação deu certo. Adriane Galisteu nestréia esta semana um novo programa no SBT. Ela deixa de apresentar o seu diário Charme à tarde para ganhar um programa noturno, às quartas-feiras, das 22h30 às 23h30. A loira recebeu de Silvio Santos carta de alforria para criar uma atração do jeitinho que ela quer. Ao que tudo indica, o novo Charme será bem diferente do que esteve no ar até a semana passada. Convidados, musicais, debates, quadros de dramaturgia e reportagens externas devem rechear a atração.
Galisteu recebeu a notícia que teria uma atração noturna no fim da semana passada, assim que Silvio Santos voltou de férias na Europa.
Além da insatisfação da loira, outro fator determinante para a mudança do Charme foi uma recente pesquisa de público realizada pelo SBT. Ficou claro na pesquisa que a audiência vespertina da emissora em nada tem a ver com o público de Galisteu.
Mas nem todos conseguem o que querem na rede. Ratinho também ganhou uma mudança de horário, mas para pior. Seu programa deixa esta semana a faixa das 18 horas e migra para as 17 horas, de segunda a sexta-feira.
Totalmente descaracterizado, o Programa do Ratinho em nada se parece com o que fez dele um sucesso nacional anos atrás, e o novo horário – 17 horas – está longe de ser ideal para alcançar o público do apresentador.
No lugar de Ratinho, às 18 horas, entra Chaves. Bem, este parece ser o único que não reclama das constantes mudanças de horário no SBT.’
TELEDRAMATURGIA
Laura Mattos
‘Band vive crise na recém-criada teledramaturgia ‘, copyright Folha de S. Paulo, 31/08/05
‘O departamento de teledramaturgia da Band, sob o comando de Herval Rossano, ainda não tem nem dez pessoas contratadas e já vive sua primeira crise: a emissora e o diretor dão informações que se contradizem sobre a novela a ser produzida em 2006, e os especiais semanais foram cancelados.
Rossano afirmou à Folha que a novela não será mais uma adaptação do romance português ‘Amor de Perdição’, de Camilo Castelo Branco. Segundo ele, a adaptação da obra pela ex-global Ana Maria Moretzsohn ‘não ficou boa’. ‘Faremos outra, ambientada em São Paulo’, disse.
Na Band, nenhum representante da cúpula quis falar oficialmente sobre o assunto. Um diretor que pediu ‘off’ (para não ser identificado) negou que a idéia do romance tenha sido abandonada.
Disse que a Band negocia parceria com a produtora portuguesa NBP a fim de viabilizar a gravação de cenas no país. Ao ser informado pela Folha sobre a desistência de Rossano, o diretor da emissora estranhou: ‘Ele falou isso? Então nós vamos ter de conversar’.
Ex-autora da TV Globo, Moretzsohn preferiu não comentar a crítica que Rossano fez a seu trabalho. ‘A direção da Band me falou que está aguardando resposta de um provável sócio português para produzir a novela’, disse.
Outro capítulo da crise são os especiais de teledramaturgia, idéia de Rossano. O diretor afirmou que foram ‘adiados’. Já para a Band, o projeto foi ‘cancelado’.
Marlene Mattos
Veterano da televisão desde os tempos da Tupi, Rossano, 70, dirigiu várias produções da Globo, dos anos 70 (‘Escrava Isaura’) até os 2000. É conhecido no meio artístico por comandar o elenco com ‘pulso firme’.
Em 2004, foi contratado pela Record para a direção da nova versão de ‘Isaura’, na qual obteve sucesso de audiência.
Saiu do canal após desentendimentos com a direção e foi para a Band, em junho deste ano.
Sua função agora é recriar o núcleo de teledramaturgia da rede. Atualmente, o canal obtém ibope satisfatório com a novelinha infanto-juvenil ‘Floribella’, gravada em parceria com a produtora independente RGB.
Nas mãos de Rossano está a produção de uma novela adulta, para o horário noturno, que deveria entrar no ar em março.
Ainda não há informações sobre um possível adiamento da estréia, mas profissionais da emissora avaliam que o projeto ainda esteja muito ‘cru’. Rossano diz que a implementação da teledramaturgia segue ‘calma e lenta’.
Na direção da Band, já há o temor de que possa ter repetido o ‘erro Marlene Mattos’. Ex-diretora da Globo e ex-sócia de Xuxa, ela foi contratada como a ‘grife’ que iria alavancar o departamento artístico, mas, segundo avaliação da cúpula da TV, teve dificuldade para trabalhar com uma estrutura pequena e verba escassa.
Rossano também está acostumado aos elevados orçamentos da Globo e não enfrentou dificuldades financeiras na Record.
O ‘bolso’ da Band é menor, mas o diretor nega que esteja enfrentando qualquer problema.’