Las grandes empresas se basan en datos. Es la fuerza invisible que impulsa la innovación, da forma a la toma de decisiones y brinda a las empresas una ventaja competitiva. Desde comprender las necesidades de los clientes hasta optimizar las operaciones, los datos son la clave que desbloquea conocimientos sobre todos los aspectos de una organización.
En las últimas décadas, el lugar de trabajo ha experimentado una transformación digital, donde el trabajo del conocimiento actualmente existe principalmente en bits y bytes y no en papel. Los diseños de productos, los documentos estratégicos y los análisis financieros se encuentran en archivos digitales distribuidos en múltiples repositorios y sistemas organizativos. Este cambio ha permitido a las empresas acceder a grandes cantidades de información para acelerar sus operaciones y posicionarse en el mercado.
Sin embargo, esta revolución impulsada por los datos conlleva un desafío oculto que muchas organizaciones apenas están empezando a comprender. A medida que profundizamos en los datos corporativos, las organizaciones están descubriendo un fenómeno que es tan común como incomprendido: los datos oscuros.
Gartner define los datos oscuros como cualquier activo de información que las organizaciones recopilan, procesan y almacenan en el curso de sus actividades comerciales normales, pero que normalmente no utilizan para otros fines.
Director jefe de productos y desarrollo, Cyberhaven.
¿Qué hace que los datos oscuros sean tan insidiosos?
Los datos oscuros a menudo contienen la propiedad intelectual e información confidencial más sensible de una empresa, lo que los convierte en una bomba de tiempo para posibles violaciones de seguridad y cumplimiento. A diferencia de los datos gestionados activamente, los datos oscuros acechan en segundo plano, desprotegidos y a menudo olvidados, pero aún accesibles para quienes saben dónde buscar.
La magnitud de este problema es alarmante: según Gartner, hasta el 80% de los datos corporativos son “oscuros”, lo que representa un enorme conjunto de riesgos potenciales y ocultos sin explotar.
Consideremos como ejemplo la información de las revisiones anuales de desempeño. Si bien los datos oficiales se almacenan en el software de recursos humanos, otra información confidencial se almacena en diferentes formas y sistemas: hojas de cálculo informales, hilos de correo electrónico, notas de reuniones, revisiones de borradores, autoevaluaciones y comentarios de pares. Los datos dispersos y a menudo olvidados muestran una imagen clara de la naturaleza compleja y potencialmente peligrosa de los datos oscuros dentro de las organizaciones.
Una sola violación que exponga esta información podría generar responsabilidad legal y multas regulatorias por manejo inadecuado de datos personales, daño a la confianza de los empleados, posibles demandas, desventaja competitiva si se filtran planes estratégicos o información salarial y daño a la reputación que podría afectar el reclutamiento y la retención. .
Las consecuencias no deseadas de la IA
La IA está cambiando la forma en que las organizaciones manejan los datos oscuros, generando oportunidades y riesgos importantes. Los grandes modelos de lenguaje ahora son capaces de examinar un vasto conjunto de datos no estructurados, convirtiendo información que antes era inaccesible en conocimientos valiosos.
Estos sistemas pueden analizar todo, desde comunicaciones por correo electrónico y transcripciones de reuniones hasta publicaciones en redes sociales y registros de servicio al cliente. Pueden revelar patrones, tendencias y correlaciones que los analistas humanos podrían pasar por alto, lo que puede conducir a una mejor toma de decisiones, una mayor eficiencia operativa y un desarrollo de productos innovadores.
Sin embargo, esta nueva capacidad de acceder a los datos también expone a las organizaciones a mayores riesgos de seguridad y privacidad. A medida que la IA descubre información confidencial de rincones olvidados del ecosistema digital, crea nuevos vectores para violaciones de datos y de cumplimiento. Para empeorar las cosas, estos datos indexados por las soluciones de inteligencia artificial a menudo se encuentran detrás de controles de acceso internos permisivos. Las soluciones de IA hacen que estos datos estén ampliamente disponibles. A medida que estos sistemas se vuelven más hábiles a la hora de conectar piezas dispares de información, pueden revelar conocimientos que nunca debieron ser revelados o compartidos. Esto puede dar lugar a violaciones de la privacidad y uso indebido de la información personal.
Cómo combatir el creciente problema
La clave está en comprender el contexto de sus datos: de dónde provienen, quién interactuó con ellos y cómo se utilizaron.
Por ejemplo, una hoja de cálculo aparentemente inofensiva se vuelve mucho más crítica si sabemos que fue creada por el director financiero, se comparte con la junta directiva y, a menudo, se accede a ella antes de las llamadas de resultados trimestrales. Inmediatamente plantea la importancia del documento y la posible sensibilidad del documento.
La forma de lograr esta comprensión contextual es a través del linaje de datos. El linaje de datos rastrea el ciclo de vida completo de los datos, incluido su origen, movimientos y transformaciones. Proporciona una visión integral de cómo fluyen los datos en una organización, quién interactúa con ellos y cómo se utilizan.
Al implementar prácticas sólidas de linaje de datos, las organizaciones pueden comprender dónde se almacenan sus datos más confidenciales y cómo se accede a ellos y se comparten: al combinar la inspección de contenido basada en IA junto con el contexto de cómo se accede y se comparte (es decir, el linaje de datos), Las organizaciones pueden identificar rápidamente los datos oscuros y evitar su extracción.
Hemos compilado una lista del mejor software de gestión de documentos.
Este artículo se produjo como parte del canal Expert Insights de TechRadarPro, donde mostramos las mejores y más brillantes mentes de la industria tecnológica actual. Las opiniones expresadas aquí son las del autor y no necesariamente las de TechRadarPro o Future plc. Si estás interesado en donar, descubre más aquí: