Há muitos anos, a jornada para a digitalização dos negócios nos leva à busca por informações relevantes nos dados gerados em operações cotidianas. Os cubos no SQL, as tabelas dinâmicas em planilhas de cálculo e a mineração de dados eram algumas das ferramentas e estratégias que costumavam ser usadas. Mais recentemente, começamos a falar de big data a partir do enorme volume de dados que estavam sendo gerados. Agora vamos ver o que são os dark data.
Com o último impulso dado pela pandemia para a transformação digital de todas as organizações, a quantidade de dados disponíveis superam qualquer coisa imaginável. O conceito popular atualmente e o de dark data. Gartner define os dados obscuros como “os ativos de informação que as organizações coletam, processam e armazenam durante as atividades empresariais habituais, mas que geralmente não utilizam para outros fins”, como a análise de negócios, o aprofundamento das relações comerciais ou a monetização direta desses dados, que muitas vezes são armazenados apenas porque a lei o estabelece.
|
Se os dados ficam imóveis, seu armazenamento e proteção podem envolver mais custos (e às vezes mais riscos) do que valor. Faz sentido? Obviamente não, especialmente quando é necessário tomar decisões impulsionadas por dados ou baseadas em dados para alcançar vantagens competitivas, melhorar resultados ou reduzir tempos de retorno de investimento.
Aprofunde-se mais nesses temas acessando nosso eBook gratuito
A necessidade de ser data-driven e outras tendências que as empresas não podem ignorar
Sabe-se bem que em cada fluxo de processos do negócio, em cada comunicação, em cada execução de tarefas em um ambiente digital, dados são gerados, muitos dados, de diferentes tipos e características. A governança de dados (data governance) é a estratégia criada por cada organização para encontrar, identificar, organizar, processar e aproveitar a maior quantidade de dark data possível, de tal forma que o valor que eles contêm possa ser desbloqueado.
Assim como um mapeamento detalhado dos sistemas, processos e circuitos pelos quais a informação viaja é fundamental para qualquer estratégia de cibersegurança, o mesmo pode ser dito para a identificação de quais informações são geradas, quando e onde, de modo que métodos possam ser projetados para obter valor a partir dos dados e levá-los da escuridão para a luz.
|
A Amazon criou uma solução para levar essas tarefas a diante: Textract. É um serviço que permite extrair texto e dados estruturados, como tabelas e formulários; além disso, permite ir além do simples reconhecimento óptico de caracteres (OCR), extraindo relações, estrutura e texto de documentos. A Microsoft não fica atrás com o seu Azure Cognitive Services, o mesmo vale para a IBM com o Datacap ou para diversas API do Google.
Continue lendo
Agenda de CIO: novas responsabilidades, oportunidades e desafios
Apesar de cargos associados à análise de dados terem surgido, as carreiras universitárias em Ciência de Dados ainda são bastante novas. Progressivamente, as organizações estão incorporando esse tipo de talento com o objetivo de trabalhar especificadamente com a identificação, recuperação e valorização dos dark data.
Apenas 35% das organizações classificam todos os seus dados. É uma pena para os outros 65% que o fazem apenas parcialmente ou não o fazem de forma alguma, pois também comprovamos que as organizações que classificam todos os seus dados tomam decisões empresariais mais eficazes e mostram maiores níveis de confiança. |
Recentemente, o escopo da governança de dados foi ampliado a partir de uma abordagem técnica (gerenciamento de dados mestre, catálogos de dados, qualidade de dados etc.) para incorporar privacidade, proteção e soberania de dados. Mas, como afirma Forrester, as organizações têm um apetite cada vez maior por aproveitar seus dados para obter vantagens empresariais, seja por meio da colaboração interna, da troca de dados entre ecossistemas, da comercialização direta, ou como base para tomar decisões comerciais impulsionadas pela Inteligência Artificial.
Claro, eles alertam, ao fazer isso, as organizações devem ter o cuidado de manter políticas que envolvam os funcionários, sócios e clientes em sua abordagem para aproveitar os dados respeitando os regulamentos vigentes (compliance).