Mineração de dados [data mining]
A quantidade de dados digitais produzida em um ano em todo o mundo alcança uma escala que só pode ser definida como elusiva. Uma estimativa da consultoria IDC indica que, em 2010, serão criados 1,2 zettabytes (ou 1,2 trilhão de gigabytes) no planeta.
[…] Mais um detalhe: além de imodesta, essa pilha tem sido multiplicada por dez a cada cinco anos. Pois tamanho tsunami de bits sempre representou um fardo para as empresas, obrigadas a investir ininterruptamente em infraestrutura para estocar e processar essas informações. Agora, contudo, esse estorvo transforma-se velozmente em uma oportunidade. Empresas de todos os portes e ramos empregam com crescente eficiência softwares que atuam como garimpeiros nessas montanhas de arquivos. Em geral, esses programas extraem detalhes até então desconhecidos sobre o negócio e, a partir daí, ajudam a criar estratégias de vendas com uma precisão inédita. A essa técnica dá-se o nome de mineração de dados – ou, no jargão em inglês, data mining.
A lógica dessa tecnologia é bastante simples. Os softwares atuam sobre a base de informações digitais de uma empresa. Depois, definem padrões e traçam correlações em torno dos hábitos dos consumidores.
[…] As novas engrenagens de data mining, porém, são mais poderosas. Elas são formadas por modelos matemáticos que constroem previsões de cenários. Assim, conseguem antecipar pormenores sobre o comportamento futuro dos consumidores. Nesse caso, a mineração funciona como uma espécie de oráculo, uma bola de cristal, cuja inspiração é nutrida por algoritmos.
Trechos da matéria da Época Negócios sobre mineração de dados. O data mining não é aplicado apenas para fins comerciais. Há algum tempo, escrevi sobre as diversas utilizações do linking data. A criação de plataformas cidadãs (e-gov) é uma delas.
Veja também
Scraping: aprenda a mixar sites
![CD [por Charles Cadé]](http://cadedigital.com/wp-content/themes/basic/themify/img.php?src=http://cadedigital.com/wp-content/themes/basic/uploads/logo/CDLogo02.png&w=&h=)