O que é Big Data?

Big data cloud vector illustration

A princípio, podemos definir o conceito de Big Data como sendo conjuntos de dados extremamente amplos e que, por este motivo, necessitam de ferramentas especialmente preparadas para lidar com grandes volumes, de forma que toda e qualquer informação nestes meios possa ser encontrada, analisada e aproveitada em tempo hábil.

A base do recurso de grande armazenamento de dados utiliza como base cinco critérios. São eles:

Volume, que está relacionado à grande quantidade de dados que possuímos dentro e fora da empresa; o segundo é a Velocidade, pois a cada segundo muitos dados novos são criados na internet, e alguns destes dados podem ser interessantes para sua empresa; o terceiro está relacionado à Variedade, sendo que o dado pode ser um compartilhamento de um texto em uma rede social, um post no blog, um review em um e-commerce; o quarto é Valor, esta é a base de maior importância para a ferramenta. O big data tem a capacidade de discernir quais dados e informações apresentam mais valor para o negócio, como a página mais acessada, a que gera mais interação e o canal com mais conversão de vendas; e por quinto e último Veracidade, o fundamento veracidade diz respeito aos dados de dinâmica humana registrados nas trilhas de navegação ou interação de redes sociais. Os dados assim catalogados são entendidos como interações reais, por isso válidos para o Big data.

Juntando estes cinco pilares, é possível analisar praticamente tudo que está público, envolvendo dados estruturados, no caso de nós conhecermos a estrutura de armazenamento daquele contexto, e também os dados não estruturados como imagens, vídeos, áudios e documentos.

Além de lidar com volumes extremamente grandes de dados dos mais variados tipos, soluções de Big Data também precisam trabalhar com distribuição de processamento e elasticidade, isto é, suportar aplicações com volumes de dados que crescem substancialmente em pouco tempo.

O problema é que os bancos de dados “tradicionais”, especialmente aqueles que exploram o modelo relacional, como o MySQL, o PostgreSQL e o Oracle, não se mostram adequados a estes requisitos, já que são menos flexíveis.

Isso acontece porque bancos de dados relacionais normalmente se baseiam em quatro propriedades que tornam a sua adoção segura e eficiente, razão pela qual soluções do tipo são tão populares: Atomicidade, Consistência, Isolamento e Durabilidade. Esta combinação é conhecida como ACID, sigla para o uso destes termos em inglês: AtomicityConsistencyIsolation e Durability.

O fato é que a ideia de Big Data reflete um cenário real: há, cada vez mais, volumes de dados gigantescos e que, portanto, exigem uma abordagem capaz de aproveitá-los ao máximo. Apenas para dar uma noção deste desafio, a IBM divulgou no final de 2012 que, de acordo com as suas estimativas, 90% dos dados disponíveis no mundo foram gerados apenas nos dois anos anteriores. Até o final de 2015, este volume todo terá aumentado pelo menos duas vezes. Diante deste ponto de vista, é um tanto precipitado encarar a expressão “Big Data” como uma mero “termo da moda”.

Fonte: Endeavor | TecMundo | InfoWester

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios são marcados com *