¿Cómo obtener valor para el negocio del dark data?
Desde hace muchos años, el camino hacia la digitalización de los negocios nos lleva a la búsqueda de información relevante en los datos que se generan en la operatoria cotidiana. Los cubos en SQL, las tablas dinámicas en las planillas de cálculo y el data mining eran algunas de las herramientas y estrategias que solían utilizarse. Más recientemente, empezamos a hablar de big data a partir del enorme volumen de datos que se estaba generando. Veamos ahora de qué se trata el dark data.
Con el último impulso que le dió la pandemia a la transformación digital de todas las organizaciones, las cantidades de datos disponibles superan todo lo imaginable. El concepto en boga, actualmente, es el de dark data. Gartner define los datos oscuros como “los activos de información que las organizaciones recogen, procesan y almacenan durante las actividades empresariales habituales, pero que generalmente no utilizan para otros fines”, como podrían ser el análisis del negocio, profundizar las relaciones comerciales o la monetización directa de esos datos, que muchas veces son almacenados sólo porque la ley así lo establece.
“Alrededor del 90% de los datos generados por la mayoría de los sensores y conversiones de información analógica a digital (A-to-D) nunca se utilizan, y el 60% de esos datos pierden su verdadero valor en milisegundos”. |
Si los datos quedan inmovilizados, su almacenamiento y protección pueden suponer más gastos (y a veces más riesgos) que valor. ¿Tiene sentido? Obviamente no, sobre todo cuando es necesario tomar decisiones data-driven o basadas en datos para lograr ventajas competitivas, mejorar resultados o reducir tiempos de retorno de la inversión.
Profundiza más sobre estos temas accediendo a nuestro eBook gratuito
La necesidad de ser data-driven y otras tendencias que las empresas no pueden ignorar
Descubriendo el valor
Es bien sabido que en cada flujo de procesos del negocio, en cada comunicación, en cada ejecución de tareas en un entorno digital, se generan datos, muchos datos, de diferentes tipos y características. El gobierno de datos (data government) es la estrategia que diseña cada organización para encontrar, identificar, ordenar, procesar y aprovechar la mayor cantidad de datos oscuros posibles, de forma tal que se pueda desbloquear el valor que encierran.
Así como un pormenorizado mapeo de sistemas, procesos y circuitos que recorre la información es clave para cualquier estrategia de ciberseguridad, lo mismo puede valer para identificar qué tipo de información se genera, cuándo y dónde, de forma tal de diseñar los métodos que permitan obtener valor de los datos y pasarlos de la oscuridad a la luz.
La Inteligencia Artificial (IA) puede ser muy útil para ayudar a dar sentido a los datos no estructurados que no se están utilizando. Al usar técnicas de IA y aprendizaje automático (machine learning), las personas pueden trabajar con el 1% de los datos oscuros y clasificar su relevancia. Luego, un modelo de aprendizaje por refuerzo puede producir rápidamente puntajes de relevancia para los datos restantes para priorizar qué datos mirar más de cerca”. Fuente: revista CIO de México |
Amazon creó una solución para llevar adelante estas tareas: Textract. Es un servicio que permite extraer texto y datos estructurados, como tablas y formularios; además, permite ir más allá del simple reconocimiento óptico de caracteres (OCR), mediante la extracción de relaciones, estructura y texto de los documentos. Microsoft no se queda atrás con su Azure Cognitive Services, lo mismo que IBM con Datacap o diversas API de Google.
Sigue leyendo
Agenda del CIO: nuevas responsabilidades, oportunidades y desafíos
Si bien se fueron perfilando roles asociados al análisis de datos, son bastante nuevas las carreras universitarias en Ciencia de Datos. Progresivamente, las organizaciones están incorporando este tipo de talentos, con el fin de trabajar específicamente con la identificación, recuperación y puesta en valor de dark data.
Sólo el 35% de las organizaciones clasifican todos sus datos. Es una pena para el otro 65% que sólo lo hace parcialmente o no lo hace en absoluto, porque también hemos comprobado que las organizaciones que clasifican todos sus datos toman decisiones empresariales más eficaces y muestran mayores niveles de confianza. |
En los últimos tiempos se amplió el alcance de la gobernanza de datos, partiendo desde un enfoque técnico (gestión de datos maestros, catálogos de datos, calidad de datos, etc.) incorporando la privacidad, protección y soberanía de los datos. Pero, como afirma Forrester, las organizaciones tienen un apetito cada vez mayor por aprovechar sus datos para obtener ventajas empresariales, ya sea mediante la colaboración interna, el intercambio de datos entre ecosistemas, la comercialización directa, o como base para la toma de decisiones empresariales impulsada por la Inteligencia Artificial.
Claro que, advierten, al hacerlo las organizaciones deben tener cuidado de mantener políticas que involucren a empleados, socios y clientes en su enfoque para aprovechar los datos respetando la normativa vigente (compliance).