Monday, 25 de November de 2024 ISSN 1519-7670 - Ano 24 - nº 1315

‘Start-ups’ dinamizam análise de dados

David Soloff está recrutando um exército de coletores de “hiperdados”. A Premise, empresa da qual ele é um dos fundadores, criou um aplicativo para smartphone que já está sendo usado por 700 pessoas em 25 países em desenvolvimento. Essas pessoas, na maioria estudantes universitários e donas de casa, fotografam alimentos e objetos de uso cotidiano em supermercados. Ao analisar as fotos dos preços e da disposição de produtos, como tomates e xampus, e ao comparar isso a outros dados, a Premise está desenvolvendo um índice inflacionário em tempo real que é vendido a empresas e operadores de mercado ansiosos por informações criteriosas.

“Em cinco anos, quero ter de 3.000 a 4.000 funcionários fazendo isso”, disse Soloff, executivo-chefe da Premise. “É um monitor da inflação global, uma forma de olhar para a segurança alimentar e uma maneira de o fabricante saber que espaço ele tem nas gôndolas.”

Coletar dados e analisá-los rapidamente se tornou uma das áreas mais quentes do setor tecnológico. A ideia é simples: com todo esse poder de processamento e um pouco de criatividade, os pesquisadores devem ser capazes de encontrar novos padrões e conexões em meio à informação. Nos últimos anos, os especialistas chamaram esse tipo de análise de Big Data. Agora, o Big Data está evoluindo, tornando-se mais “híper” e incluindo fontes de todo tipo. Start-ups como a Premise e a ClearStory Data, bem como empresas maiores, caso da General Electric, estão começando a agir.

Informações disponíveis

Estatísticas padronizadas poderiam projetar as vendas de sorvete no próximo verão. O objetivo das pessoas que trabalham nos mais novos sistemas de Big Data é coletar informações aparentemente sem correlação, como a temperatura e a nebulosidade de hoje e a vitória do time da cidade no fim de semana, e compará-las com informações climáticas e resultados esportivos anteriores, de modo a descobrir quanto sorvete de menta com gotas de chocolate as mães comprariam hoje.

Há sinais preliminares de que isso funcione. A Premise afirma que, ao acompanhar os preços da cebola em alguns mercados da Índia, identificou uma forte inflação nacional meses antes do governo. Os fotógrafos que trabalham para a Premise recebem até 0,10 dólar por foto. A Premise também coleta pelos celulares informações sobre o local e o horário da imagem. Os dados de preço contidos nas fotos são misturados aos preços encontrados em 30 mil websites. A Premise, então, cria índices nacionais de inflação e mapas de preços abrangendo mercados em lugares como Xangai e Rio de Janeiro. Entre os assinantes da Premise estão hedge funds (fundos de investimentos de alto risco) de Wall Street e a Procter & Gamble.

As novas conexões do Big Data também se beneficiam da crescente quantidade de informações públicas disponível. De acordo com o Instituto Global McKinsey, 40 governos nacionais atualmente oferecem dados a respeito de assuntos como população e uso fundiário. Esses dados governamentais podem ser combinados com sensores em smartphones, em motores de jatos e até mesmo em pontos de aluguel e de empréstimo de bicicletas que estejam lançando dados em sistemas de computação em nuvem.

Dados de fontes diferentes

Anos atrás, era caro obter dados e difícil carregá-los nos computadores. Mas, com a queda do preço dos sensores e o advento de recursos como o wi-fi, isso mudou. A computação em memória – um avanço que permite que os dados sejam analisados sem precisarem ser armazenados em um local diferente – aumentou as velocidades de processamento, garantindo a análise dos dados em tempo real. A General Electric, por exemplo, que tem mais de 200 sensores em um único motor a jato, trabalhou com a Accenture para construir um negócio de análise do desempenho de aeronaves no momento em que o jato aterrissa.

A análise tradicional de dados se desenvolveu com base na observação das informações, como é o caso de canhotos de folhas de pagamento, que podem ser lançados numa planilha. Com a explosão da internet, porém, empresas como Google, Facebook e Yahoo! se viram diante de volumes sem precedentes de dados “não estruturados”, como o modo de as pessoas navegarem na web ou os comentários que elas fazem. Novos equipamentos e softwares reduzem o tempo de análise dessas informações.

A ClearStory Data, start-up da Califórnia, lançou um produto capaz de examinar dados de diferentes fontes. Informações sobre a venda de ingressos de cinema, por exemplo, poderiam ser cruzadas com dados sobre o clima e mensagens do Twitter. Sharmila Shahani-Mulligan, da ClearStory, disse que o truque foi desenvolver um jeito de encontrar rapidamente fontes de dados e descobrir como mostrar as informações de um modo proveitoso. “Uma lanchonete pode saber se os clientes vão beber Red Bull ou chocolate quente.”

******

Quentin Hardy, doNew York Times