Les comparto el video donde la SIC (Superintendencia de Industria y Comercio), autoridad en Colombia para inspeccionar y vigilar el cumplimiento de la ley 1581 de 2012 (Hábeas Data), anuncia la culminación del Sandbox del cual fuimos beneficiarios, para aplicar la inteligencia artificial (IA) en un nuevo proceso enfocado a contrarrestar la suplantación, con la expectativa de que fuese referente de buenas prácticas en el tratamiento de datos personales (TDP) ‘desde el diseño y por defecto’.
Qué entendemos por suplantación (el problema):
El concepto ‘suplantación’ es una mala práctica que, en resumidas cuentas, permite almacenar ‘falsos positivos’ o personas indebidamente tratadas en las bases de datos por no corresponder a sus verdaderos titulares, lo cual es una de las principales causales de multas impartidas por la SIC. Para abordar el problema, resumimos la suplantación en dos grandes escenarios: a) por negligencia y b) por delincuencia, aunque no obstante ambos conducen a similares efectos perjudiciales (quejas, reclamos, multas, estafas, fraudes, deterioro de imagen, desconfianza, injusticia, inmoralidad, …).
Aunque el problema es mucho más complejo según el análisis de las consecuencias y sus correspondientes causas, la suplantación se presenta en diferentes tipologías o casuísticas -sobre las cuales no entraremos en detalles aún- pero que constituyen una de las formas de corrupción que ha venido creciendo considerablemente en Colombia, originada en situaciones de relacionamiento de naturaleza tanto virtual como presencial y que trasciende el ámbito de las bases de datos, aunque no del tratamiento de datos personales, propósito básico de la ley.
Qué entendemos por Inteligencia Artificial (IA – la solución):
Titulamos este mensaje con una frase que tomamos de uno de los documentos que escogimos para tratar de ‘desmitificar’ la IA, tema que nos ha tenido ocupados desde enero de 2022 (a raíz del sandbox). Me gustó la frase por lo de ‘simplemente’, quizás por lo de aquella ‘ley del menor esfuerzo’ (a la que algunos solemos acostumbrarnos), pero la realidad ha sido otra. Diseñar un ‘individuo’ (o mejor, un algoritmo) que piense, se concentre y disfrute -como lo hacemos nosotros- no es tarea fácil y, peor aún, cuando a alguien de nuestro equipo se le ocurrió la idea de que dicho ‘ejercicio cerebral’ fuese llevado a cabo por una ‘máquina que aprendiera’ a actuar de manera libre, voluntaria y consciente.
Otro miembro del equipo (aún más creativo) sugirió tratar de obtener automáticamente los datos (ámbito al que denominamos ‘mundo virtual’) tal como lo hacen los órganos de los sentidos con los estímulos percibidos y provenientes del ‘mundo natural’. Otro fue aún más allá al sugerir que dicho individuo pudiese distinguir entre un estímulo ‘preciso’ de otro ‘difuso’, aunque no precisó a qué tipo de estímulos se refería ( aquí nació un concepto que denominamos ‘HipoData’, o debajo de los datos).
He estado tratando de imaginarme tal dispositivo, que evidentemente no se regiría por las leyes de la física -como sí lo hacen las computadoras actuales- que fuese capaz de percibir un simple olor o sabor y de desencadenar toda una historia a partir del correspondiente valor cuantitativo o cualitativo (dato).
Por ejemplo, que sea capaz de discriminar el olor, o incluso aún, el sabor de la parte protuberante de una hormiga culona con respecto a un grano de maní y conducirme de nuevo a la infancia, pero, la verdad, la motivación que me genera no es de ocupación sino más bien de preocupación. A la suma de ambos mundos (natural y virtual) sí le dimos el nombre de nuevo ‘mundo real’, pero preferimos dejarle este tipo de ocupaciones a los libretistas de Hollywood. A lo mejor titularán la película como ‘El IoT de los nuevos humanos’ o ‘Terminator 2050’ o algo parecido.
En otras palabras, se planteó crear un dispositivo que funcionara en computadoras que se rigieran por leyes propias de los seres vivos, por lo que mejor preferimos volver a poner los pies sobre la tierra. En ‘pensar’ acerca del problema de la suplantación, en ‘concentrarnos’ para diseñar un algoritmo que interactúe con seres humanos, justos o pecadores (y que de paso cumpla con la ley), y en ‘disfrutar’ del resultado basado en dichas interacciones, esto es, inferir si la persona es (o no) quien dice ser.
Un algoritmo que interactúe tanto con negligentes como con delincuentes. Los primeros, evidentemente hacen que las organizaciones incumplan la ley, mientras que los segundos además delinquen, quizás también haciendo el ejercicio cerebral y utilizando la inteligencia natural para pensar, concentrarse y disfrutar, a su manera.
Cuál fue el mensaje más importante que nos dejó la SIC:
Dicen que la diferencia entre un teólogo y un filósofo es que ante una pregunta el teólogo genera 10 respuestas, mientras que ante una respuesta el filósofo genera 10 preguntas. En tal sentido, en el Sandbox la autoridad -experta en la ley- actuó como teólogo ante nuestras preguntas, mientras que el equipo de Wolman Group -experto en calidad de datos- actuó como filósofo ante sus respuestas. Aunque la SIC no avala ni nada ni a nadie -por ser la autoridad- en procura de mantener su independencia, el aprendizaje que nuestro equipo obtuvo en el Sandbox fue invaluable.
Los funcionarios de la SIC (técnicos y abogados) reiteraban que “sin seguridad no puede existir el debido tratamiento de los datos personales”. Luego de varias reuniones, en la medida en que se iba estableciendo mayor nivel de confianza, me atreví a adicionarle la frase “pero sin calidad mucho menos”. Recordé a mi profesor de algebra del Instituto Tecnológico Santandereano -Gilberto Arenas- cuando nos hablaba -siendo aún unos chinos- de “el ‘pero’ que daña matrimonios”, quizás influenciado por el temor de poder alterar el cordial relacionamiento con la autoridad que se había mantenido durante el Sandbox.
Ese “pero” fue una de nuestras principales conclusiones que sacamos del Sandbox, aunque no había nada de qué temer, puesto que ‘la calidad o veracidad de los datos’ es uno de los principios rectores enunciados en la ley y, de hecho, es otra de las causales más representativas por las cuales se han impuesto multas relacionadas con su incumplimiento.
Recordé un dicho que escuché por primera vez de mi abuela Elvia: “la cadena se revienta por el más débil de los eslabones”, que asociándolo a la ley podría ser “las multas se generan por el más débil de los principios rectores”. Logramos compartir con la autoridad muchos milagros (pero ningún santo), tratados en interacciones constructiva y profesionalmente manejadas, viendo la ley como un todo integral desde nuestra perspectiva -de ingenieros de sistemas- puesto que la ‘limpieza’ e integración de los datos han sido los temas que nuestros clientes nos han encargado el tratamiento durante los últimos 28 años. En otras palabras, nos han confiado uno de los recursos más valiosos que pudiese tener organización alguna.
Con el Sandbox descubrimos una oportunidad, pero sobre todo un desafío, por lo que iniciamos la fabricación de una nueva generación de productos y servicios (o procesos), ahora enfocados a la ‘desinfección’, tomando como precondición la ‘limpieza’ de los datos.
De qué premisa fundamental partimos para abordar la solución del problema:
Para abordar la solución, partimos de la premisa fundamental: “tanto los modos como los medios a partir de los cuales se crean y mantienen las conexiones en el ámbito de las sinapsis, funcionan -en cierta forma- como una base de datos de las que acostumbramos a tratar (tipo numérico, alfanumérico, …)”. En tal sentido, si desconocemos la calidad de nuestras creencias, inexorablemente el estadio del disfrute nos será muy esquivo. La primera pregunta que surgiría es ¿y cómo se mide la calidad de las creencias? pero, también y consecuentemente con el tema que nos ocupa, ¿y cómo se mide la calidad de los datos?
Cuál es el estado actual de la solución del problema:
La solución de ‘limpieza’ afortunadamente ya es un hecho cumplido. Aplicamos una técnica de IA (análisis de afinidad) que aprendí hace más de 30 años del doctor James Martin, uno de los creadores de ‘Information Engineering’, para lo cual ofrecemos la prueba de concepto (online y back office) a quienes estén interesados (inscribirse en el formulario de al lado).
Para la ‘desinfección’ estamos desarrollando nuestro propio método ‘biométrico’ que denominamos ‘huella vivencial’, por almacenar un nuevo tipo de datos a los que les dimos la clasificación de ‘ultrasensibles’, por lo que exigen para su tratamiento 100% tanto de seguridad como de confidencialidad, método que esperamos sea más eficiente, eficaz y económico que los convencionales y que se pueda usar con una API en cualquier tipo de formulario de entrada de datos.
La desinfección es mucho más compleja que la limpieza puesto que los suplantadores usualmente ya tienen todos los datos del suplantado, y si es un delincuente, el asunto se vuelve aún más complejo, puesto que la calidad de los datos que proporcionan es aparentemente del 100%. Mientras hay quienes nos movemos en el ámbito de la legalidad tratando de hacer cosas nuevas conforme a la ley, hay otros que se mueven en el ámbito de la inmoralidad, puesto que además de incumplir la ley, delinquen. Unos tratamos de aplicar la inteligencia artificial para contrarrestar riesgos de quienes usan su inteligencia natural para defraudar a otros.
El símil con los datos salió de una propaganda en televisión -cuando estaba aún más joven- en que anunciaban un producto de cuyo nombre no recuerdo, llamémoslo ‘DIQUALITY’, donde una ama de casa pasando un limpión untado con ese producto por una mesa de vidrio decía:
“DIQUALITY; limpia la mugre que se ve y desinfecta la que no se ve”.