Estrategia de Transformación AI

Framework de clasificación de datos de 4 niveles para decisiones de acceso de AI mostrando el mapeo de niveles a categorías de herramientas de AI aprobadas

El incidente de gobernanza de AI más común no es una alucinación. Es un empleado que pega PII de clientes, un contrato confidencial o datos financieros internos en una herramienta de AI pública. Ocurre diariamente en empresas sin una política de clasificación de datos para AI.

No porque los empleados sean descuidados. Porque nadie les explicó las reglas. Y las reglas que sí tienen, la política de clasificación de datos de su auditoría SOC 2, no fueron escritas para AI.

Este artículo le brinda el framework de clasificación de datos de 4 niveles específico para AI: qué categorías de datos pueden ir en qué niveles de herramientas de AI, cómo mapear eso al panorama de proveedores, cómo luce el piso legal bajo GDPR Article 22, y cómo aplicarlo sin hacer que la AI sea inutilizable. Es un complemento de Cómo Construir su Política de Uso de AI, donde este framework se operacionaliza.

Por qué su política de clasificación de datos existente no es suficiente

Key Facts: Brechas de Gobernanza de Datos de AI

El 43% de las organizaciones cita la calidad y preparación de datos como su principal obstáculo para el éxito de la AI, pero las políticas de clasificación de datos de la mayoría de las organizaciones fueron escritas antes de que existieran los sistemas de AI y no abordan las tres rutas de exposición específicas de AI (Informatica, 2025)

GDPR Article 22 aplica a sistemas de AI que toman decisiones automatizadas de consecuencia sobre individuos (crédito, contratación, acceso a servicios), y las acciones de cumplimiento por infracciones del GDPR ahora promedian decenas de millones de euros para infracciones a escala empresarial en la UE (EU Data Protection Board, 2025)

Las herramientas de AI de nivel consumidor (ChatGPT gratuito, cuentas personales de Claude) no tienen acuerdos formales de procesamiento de datos, lo que significa que cualquier dato pegado en ellas no tiene protección contractual contra el uso de entrenamiento o retención; se estima que el 78% de los empleados usa dichas herramientas para el trabajo sin conocimiento de estos términos (Microsoft, 2024)

La mayoría de las empresas con cualquier madurez de gobernanza tienen una política de clasificación de datos. Llegó con la auditoría SOC 2 o la certificación ISO 27001. Define niveles como Público, Interno, Confidencial y Restringido. Se supone que los empleados deben manejar cada nivel de manera apropiada.

Pero esas políticas fueron diseñadas para un modelo de amenaza diferente. Asumieron que los datos permanecen en sistemas que usted controla, compartidos con personas dentro o fuera de la organización, protegidos por controles de acceso y cifrado.

Los sistemas de AI cambian el modelo de amenaza de tres maneras específicas que la mayoría de las políticas existentes no abordan. NIST SP 800-60 es el estándar federal para mapear tipos de información a categorías de seguridad, y proporciona el framework fundamental para la clasificación de datos, pero es anterior a los sistemas de AI modernos y necesita extenderse para contemplar las rutas de exposición específicas de AI.

Entrenamiento con input. Las herramientas de AI de nivel consumidor, y algunas empresariales con configuraciones predeterminadas, pueden usar sus inputs para entrenar o ajustar sus modelos. Si un empleado pega un documento de estrategia confidencial en una cuenta pública de ChatGPT, ese contenido puede convertirse en parte de los datos de entrenamiento del modelo, accesible en forma fragmentada para cualquiera que haga las preguntas correctas. La clasificación de datos tradicional asume que se está protegiendo contra el acceso no autorizado. El entrenamiento con input crea un tipo diferente de exposición: sus datos se convierten en parte del modelo en sí. Esta es también la razón por la que la IP y el copyright en los outputs de AI es una preocupación de gobernanza adyacente.

Retención y recuperación de prompts. Muchas herramientas de AI retienen el historial de conversaciones. Algunas lo hacen accesible a otros usuarios o al proveedor para revisión de calidad. Un representante de ventas que pega la discusión del presupuesto de un prospecto en una herramienta de AI para redactar una propuesta puede dejar esa conversación accesible en los sistemas del proveedor indefinidamente.

Enrutamiento de modelos de terceros. Muchas herramientas de productividad de AI no ejecutan sus propios modelos. Enrutan sus prompts a OpenAI, Anthropic o Google en el backend. La pregunta de gobernanza no es solo sobre la herramienta de AI que ve. Es sobre cada proveedor de modelos en la cadena.

Su política de clasificación de datos existente probablemente dice "los datos Confidenciales deben estar cifrados en reposo y en tránsito." Eso es correcto pero insuficiente. No dice nada sobre si los datos Confidenciales pueden enviarse a un proveedor de modelos de terceros con o sin un acuerdo de procesamiento de datos (DPA). La política específica de AI llena esa brecha.

"Su política de clasificación de datos existente asume que los datos permanecen en sistemas que usted controla. La AI cambia esa suposición de tres maneras: la herramienta puede entrenar con sus inputs, retiene el historial de conversaciones, y puede enrutar prompts a proveedores de modelos de terceros que usted no ha revisado. Una política que dice 'los datos Confidenciales deben estar cifrados en reposo y en tránsito' no aborda ninguno de estos tres riesgos." (Rework)

El Esquema de Acceso de Datos de AI de 4 Niveles

Un framework de clasificación estructurado diseñado específicamente para las decisiones de acceso a herramientas de AI, que extiende la clasificación de datos tradicional para contemplar las rutas de exposición específicas de AI (entrenamiento con input, retención de prompts, enrutamiento de modelos de terceros). Nivel 1 (Público): datos ya públicos, permitidos en cualquier herramienta aprobada. Nivel 2 (Interno): datos operativos rutinarios, permitidos en herramientas de AI empresariales con un DPA firmado y compromiso de no entrenamiento. Nivel 3 (Confidencial): PII de clientes, datos financieros, contratos e IP, requiere solo despliegues de AI en nube privada o en premisas. Nivel 4 (Restringido): datos de HIPAA, GLBA, biométricos y bajo retención de litigios, sin AI externa sin aprobación legal explícita y compromisos contractuales escritos. El esquema mapea los niveles de datos a categorías de herramientas, permitiendo a los empleados tomar decisiones correctas de acceso de AI sin consultar documentos de política en cada interacción.

El framework de clasificación de datos de AI de 4 niveles

Este framework está diseñado para responder una pregunta práctica: ¿puede este dato entrar en esa herramienta de AI?

Nivel 1: Público

Definición: Datos que ya son públicos, o que no tendrían ningún impacto empresarial significativo si se hicieran públicos.

Ejemplos:

Contenido de su sitio web público, blog y materiales de marketing
Información pública de competidores (de su sitio web público, comunicados de prensa, presentaciones públicas)
Conocimiento empresarial e industrial general no específico de su empresa
Orientación regulatoria pública y documentos de estándares
Contenido de bases de conocimiento públicas, Wikipedia, investigación pública

Permiso de herramienta de AI: Cualquier herramienta de AI aprobada, incluyendo herramientas de nivel consumidor y herramientas sin DPA formal, puede procesar datos de Nivel 1.

Cadencia de auditoría: No se requiere auditoría específica. Los datos de Nivel 1 por definición no tienen sensibilidad que proteger.

Nota: Público no significa "bajo impacto para la tarea." Un equipo de marketing que usa el comunicado de prensa público de un competidor como input para análisis competitivo está usando datos de Nivel 1 aunque el output empresarial importe. La clasificación es sobre los datos de entrada, no sobre la importancia estratégica del trabajo.

Nivel 2: Interno

Definición: Datos que no son públicos pero que tendrían impacto empresarial limitado si se divulgaran. Incluye la mayoría de los datos operativos rutinarios, documentación de procesos internos y comunicaciones empresariales no sensibles.

Ejemplos:

Documentación de procesos internos y procedimientos operativos estándar
Notas de reuniones internas rutinarias (sin contenido estratégico o financiero)
Comunicaciones internas de empleados no sensibles
Datos de gestión de proyectos internos sin contenido financiero o estratégico
Descripciones generales del roadmap del producto que no incluyen detalles competitivamente sensibles
Datos de clientes agregados y anonimizados sin identificadores individuales

Permiso de herramienta de AI: Los datos de Nivel 2 pueden ser procesados por herramientas de AI de nivel empresarial que tengan:

Un Acuerdo de Procesamiento de Datos (DPA) firmado con la empresa
Un compromiso de no entrenamiento con input en el acuerdo empresarial
Certificación SOC 2 Type II o equivalente

Las herramientas que cumplen estos criterios incluyen OpenAI Enterprise, Anthropic Claude for Business, Microsoft 365 Copilot (dentro de su límite de cumplimiento de M365) y Google Workspace con Gemini for Workspace.

Las herramientas de nivel consumidor (ChatGPT gratuito, cuentas personales de Claude.ai, cuentas personales de Google Bard) no están aprobadas para datos de Nivel 2.

Cadencia de auditoría: Revisión trimestral de los acuerdos de herramientas empresariales para confirmar que los términos del DPA siguen vigentes y los compromisos de no entrenamiento continúan en efecto.

Nivel 3: Confidencial

Definición: Datos cuya exposición causaría daño material empresarial, legal o reputacional. Requiere la mayor protección para la mayoría de las operaciones empresariales.

Ejemplos:

PII de clientes (nombres, direcciones de correo electrónico, números de teléfono, direcciones) en cualquier forma identificable
Datos de uso de clientes, historial de transacciones y detalles de cuenta
Contratos firmados y acuerdos legales
Proyecciones financieras, pronósticos y resultados no publicados
Materiales relacionados con M&A (listas de objetivos, términos de acuerdos, due diligence)
Propiedad intelectual, algoritmos propietarios y código fuente que contiene lógica sensible
Datos personales de empleados (registros de RR. HH., evaluaciones de rendimiento, compensación)
Comunicaciones privilegiadas abogado-cliente
Materiales del directorio y documentos estratégicos a nivel de directorio

Permiso de herramienta de AI: Los datos de Nivel 3 requieren:

Un despliegue de AI en nube privada con su organización como único inquilino, y datos que nunca salen de su entorno
Un despliegue de AI en premisas ejecutándose en su propia infraestructura
Una herramienta de AI empresarial con garantías explícitas de residencia de datos, servicio de modelos en air-gap, y un compromiso contractual de que los datos nunca se usan para entrenamiento ni son accesibles al personal del proveedor

En 2026, la mayoría de las herramientas de AI empresariales comerciales (incluyendo OpenAI Enterprise, Anthropic Claude for Business y Microsoft Copilot) no son apropiadas para datos de Nivel 3 de forma predeterminada. Algunos ofrecen opciones de despliegue privado con costo adicional. Verifique la configuración específica con su proveedor.

Cadencia de auditoría: Revisión mensual de qué empleados han procesado datos de Nivel 3 a través de cualquier flujo de trabajo de AI, con reporte de excepciones para cualquier dato de Nivel 3 que haya entrado en una herramienta aprobada para Nivel 2.

Nota sobre GDPR: La PII de clientes en el Nivel 3 está sujeta a los requisitos de toma de decisiones automatizadas de GDPR Article 22 cuando la AI toma decisiones de consecuencia sobre individuos. Consulte la sección del Piso Legal a continuación.

Nivel 4: Restringido

Definición: Datos cuya exposición crearía consecuencias legales, financieras o de seguridad graves. Requiere revisión legal y de seguridad explícita antes de cualquier uso de AI.

Ejemplos:

Datos médicos y de salud cubiertos por HIPAA (registros de pacientes, historiales de tratamiento, datos clínicos)
Datos financieros regulados cubiertos por GLBA o regulaciones bancarias (decisiones de préstamos, datos de crédito, registros financieros a nivel de cuenta sujetos a supervisión regulatoria)
Datos cubiertos por regulaciones sectoriales específicas con restricciones de AI explícitas (datos de menores bajo COPPA, ciertos registros educativos bajo FERPA)
Secretos de estado y datos relevantes para la seguridad nacional (relevantes para contratistas gubernamentales)
Datos bajo retención activa de litigios o sujetos a una orden judicial
Identificadores biométricos (huellas dactilares, datos de reconocimiento facial, huellas de voz)

Permiso de herramienta de AI: Ninguna herramienta de AI externa, incluyendo las de nivel empresarial, puede procesar datos de Nivel 4 sin aprobación escrita explícita del CISO y el asesor legal, compromisos contractuales específicos del proveedor sobre el manejo de datos, y documentación de por qué no hay ningún enfoque alternativo viable.

En la mayoría de los casos, la respuesta apropiada para los datos de Nivel 4 es la AI en premisas sin transmisión de datos externa. Para industrias reguladas, consulte a su asesor de cumplimiento antes de cualquier uso de AI con datos de Nivel 4.

Cadencia de auditoría: Cualquier uso de AI de Nivel 4 requiere revisión y documentación caso por caso. No hay un flujo de trabajo rutinario de AI de Nivel 4 que opere en una auditoría programada; cada instancia es una excepción.

Mapeo de niveles de datos al panorama de proveedores

Esta tabla mapea los niveles de datos a categorías de herramientas. Úsela como árbol de decisión en su política de uso de AI.

Categoría de Herramienta	Ejemplos	Nivel 1	Nivel 2	Nivel 3	Nivel 4
AI de consumidor (sin DPA)	ChatGPT gratuito, Claude.ai personal, Gemini personal	Permitido	No Permitido	No Permitido	No Permitido
AI empresarial (DPA + SOC 2)	OpenAI Enterprise, Anthropic Claude for Business, Google Workspace + Gemini, Microsoft 365 Copilot	Permitido	Permitido	No Permitido (predeterminado)	No Permitido
AI en nube privada (inquilino único)	Azure OpenAI Service (despliegue privado), AWS Bedrock (aislado), GCP Vertex AI (aislado)	Permitido	Permitido	Permitido (con revisión de configuración)	Revisión caso por caso
AI en premisas	Llama, Mistral o modelos fine-tuned desplegados localmente en hardware de la empresa	Permitido	Permitido	Permitido	Permitido (con revisión legal)

Los encabezados de columna son los niveles de datos. Los valores de celda indican si esa categoría de herramienta puede procesar ese nivel de datos. Lea la tabla como: "¿Puedo usar esta categoría de herramienta para datos en este nivel?"

Una nota sobre las configuraciones de "nube privada". Varios proveedores de AI empresariales ofrecen opciones de despliegue privado o aislado donde sus datos permanecen en un entorno dedicado, las llamadas al modelo nunca salen de su región de nube, y el equipo de operaciones del proveedor no tiene acceso a sus datos. Estas configuraciones son costosas y operativamente complejas, pero son el puente entre las herramientas de nivel empresarial y los despliegues en premisas para datos de Nivel 3. Si su proveedor ofrece esto, obtenga los compromisos contractuales específicos (SLA de residencia de datos, compromiso de no acceso de operaciones, acceso a registros de auditoría) por escrito antes de tratarlo como aprobado para Nivel 3.

Para las empresas que operan en o sirven a la Unión Europea, GDPR Article 22 establece el mínimo legal para la toma de decisiones basada en AI que involucra datos personales.

Lo que dice el Article 22. GDPR Article 22 da a los interesados el derecho a no ser sujetos a decisiones basadas únicamente en el procesamiento automatizado que produzcan efectos legales o significativos similares. "Únicamente automatizado" significa sin revisión humana significativa. "Efectos legales o significativos similares" incluye decisiones de crédito, decisiones de empleo, acceso a servicios y resultados de consecuencias similares.

Lo que esto significa para los flujos de trabajo de AI. Si su AI toma una decisión de consecuencia sobre una persona (una puntuación de crédito, una recomendación de contratación, una asignación de nivel de servicio al cliente, una puntuación de lead que determina quién es contactado) y esa decisión se toma sin revisión humana significativa, tiene un problema con GDPR Article 22 para los interesados de la UE.

La postura práctica de cumplimiento. Cualquier flujo de trabajo de AI de tipo Predict o Execute que tome decisiones de consecuencia sobre individuos identificables necesita:

Un paso de revisión humana en el proceso que sea genuinamente significativo (no un sello de goma)
Una base documentada para el procesamiento (interés legítimo o consentimiento explícito)
Un mecanismo para que el individuo solicite revisión humana y cuestione el resultado

Este no es un requisito específico de AI. Aplica a cualquier toma de decisiones automatizada sobre personas. Pero la AI ha aumentado dramáticamente el volumen y la sofisticación de las decisiones automatizadas que hacen las empresas, lo que significa que el cumplimiento con GDPR Article 22 es ahora una preocupación de gobernanza activa para cualquier empresa que realice trabajo significativo de AI con datos de clientes o empleados.

CCPA (California). La Ley de Privacidad del Consumidor de California otorga a los consumidores derechos sobre la toma de decisiones automatizadas que involucran su información personal. Las empresas sujetas a CCPA deben asegurarse de que sus flujos de trabajo de AI que involucran a consumidores de California incluyan los mecanismos apropiados de divulgación y exclusión voluntaria consistentes con los Reglamentos de CCPA vigentes desde marzo de 2025.

HIPAA. Cualquier procesamiento de AI de información de salud protegida (PHI) requiere un Acuerdo de Socio Comercial (BAA) con el proveedor de AI. La PHI es de Nivel 4 de forma predeterminada. Si su proveedor no puede firmar un BAA, la PHI no puede entrar en su herramienta.

GLBA. Las instituciones financieras sujetas a la Ley Gramm-Leach-Bliley deben asegurarse de que las herramientas de AI que procesan información financiera de clientes cumplan con los requisitos de la Regla de Salvaguardias para proteger los datos de los clientes.

Aplicación práctica: cómo hacerla funcionar sin hacerla dolorosa

Los frameworks de clasificación fallan no porque estén mal diseñados sino porque son imposibles de seguir en la práctica. Aquí está cómo hacer que este funcione realmente.

Etiquete los datos en la fuente. Integre etiquetas de nivel en los sistemas donde viven los datos. Bibliotecas de documentos de SharePoint con etiquetas de sensibilidad. Campos de CRM etiquetados por nivel de datos. Sistemas de gestión de contratos con metadatos de clasificación. Cuando los datos están etiquetados donde viven, los empleados no tienen que recordar las reglas de clasificación. La herramienta les dice.

Plantillas de prompts que aplican la clasificación. Para equipos que usan herramientas de AI intensivamente, proporcione plantillas de prompts aprobadas que pre-clasifiquen el input. Una plantilla de equipo de ventas para redacción de propuestas que dice "Inserte aquí solo información interna sobre su empresa" recuerda a los usuarios qué nivel es apropiado sin requerir que consulten un documento de política durante la tarea.

Capacitación anclada en ejemplos reales. La capacitación en clasificación que da a los empleados escenarios reales de su trabajo es más efectiva que las reglas abstractas. "Cuando está pegando este contrato de cliente en el asistente de redacción, eso son datos de Nivel 3, lo que significa que la herramienta de AI de contratos debe ser nuestro despliegue en premisas, no ChatGPT Enterprise." Lo concreto supera a lo abstracto.

Revisión de patrones de incidentes. La mayoría de las infracciones de clasificación no son deliberadas. Son el resultado de empleados que no conocen o no piensan en la regla en el momento relevante. Revise los patrones de incidentes trimestralmente: qué tipos de datos van a dónde, dónde se agrupan las infracciones, si equipos o herramientas específicas tienen mayor riesgo. Use los patrones para refinar la capacitación, no solo para asignar culpa.

Manejo de excepciones. A veces surge un caso de uso de Nivel 3 que tiene una necesidad empresarial legítima y podría abordarse con la opción de despliegue privado de un proveedor. Construya un proceso de excepción: solicitud, revisión del CISO, verificación de compromiso contractual específico, aprobación por tiempo limitado. Tener una ruta formal de excepción evita que los equipos se queden bloqueados o actúen por su cuenta.

Auditoría del cumplimiento

Registre lo que entra. Las herramientas de AI empresariales con DPAs deben proporcionar registros de auditoría de los inputs de prompts y el empleado que los envió. Actívelo. Revise los registros trimestralmente para detectar contenido de Nivel 3 o Nivel 4 en herramientas no aprobadas para esos niveles.

Verificaciones puntuales en roles de alto riesgo. Los roles que regularmente manejan datos de Nivel 3 o Nivel 4 (finanzas, legal, RR. HH., ventas con acceso a grandes contratos) justifican un monitoreo más cercano. Verificaciones puntuales trimestrales revisando los registros de uso de herramientas de AI frente a las reglas de nivel de datos.

Análisis de reporte de incidentes. Cada incidente de AI reportado debe evaluarse en cuanto a sus implicaciones de clasificación de datos. ¿Fue el incidente causado por datos de Nivel 3 en una herramienta de Nivel 2? Esa es una brecha de aplicación de clasificación. ¿Fue causado por usar una herramienta no aprobada? Esa es una brecha de shadow AI. Categorice los incidentes para identificar problemas sistémicos frente a errores aislados.

Revisión completa anual. Los tipos de datos cambian a medida que el negocio evoluciona. Se añaden nuevas fuentes de datos. Los requisitos regulatorios cambian. Revise toda la lista de asignaciones de niveles anualmente para asegurarse de que la clasificación aún coincida con los datos empresariales actuales y los requisitos regulatorios actuales.

La clasificación le dice qué datos pueden ir a dónde. Pero el problema más difícil es saber qué hacer cuando un flujo de trabajo de AI toca datos clasificados y algo sale mal, que es la pregunta que el proceso de puertas de aprobación y revisión de proveedores debe responder primero.

Rework Analysis: Basado en los patrones de incidentes de gobernanza de datos de AI, la infracción más frecuente es el procesamiento de datos de Nivel 3 (PII de clientes, contratos, proyecciones financieras) en herramientas aprobadas para Nivel 2 (ChatGPT empresarial, Claude for Business), no en herramientas de nivel consumidor. Esto ocurre porque los empleados correctamente evitan las herramientas de consumidor pero no se dan cuenta de que su herramienta de nivel empresarial no está aprobada para datos de Nivel 3 en su configuración predeterminada. Los datos de Nivel 3 requieren despliegue en nube privada (con compromisos contractuales específicos) o AI en premisas. La tabla de clasificación de proveedores en este artículo está diseñada específicamente para hacer visible el límite Nivel 2/Nivel 3 en lugar de asumir que los empleados leerán la letra pequeña en los acuerdos empresariales.

Qué leer a continuación

Lea: Cómo Construir su Política de Uso de AI para la estructura de política de 6 secciones que operacionaliza este framework de clasificación.

Lea: Puertas de Aprobación de AI y Revisión de Proveedores para la lista de verificación de evaluación de proveedores que determina en qué nivel de herramientas cae un nuevo producto de AI.

Lea: Registro de Riesgos de AI: Qué Monitorear para ver cómo las infracciones de clasificación de datos encajan en su seguimiento más amplio de riesgos de AI.

Lea: Los 7 Tipos de Datos que Alimentan la AI Empresarial para entender qué tipos de datos alimentan las capacidades de AI y cuáles tienen los mayores requisitos de gobernanza.

Vea también:

Trazas de Auditoría para Acciones Execute de AI: los requisitos de registro para flujos de trabajo de AI con capacidad Execute que manejan datos clasificados
Preparación de Datos: El Prerrequisito que la Mayoría de los Proyectos de AI Omiten: entender la calidad de los datos antes de que se puedan aplicar las reglas de acceso de AI

Victor Hoang

Co-Founder & CMO, Rework

Estrategia de Transformación AI

Clasificación de Datos para Acceso de AI: Un Framework de 4 Niveles para CIOs

Por qué su política de clasificación de datos existente no es suficiente

El Esquema de Acceso de Datos de AI de 4 Niveles

El framework de clasificación de datos de AI de 4 niveles

Nivel 1: Público

Nivel 2: Interno

Nivel 3: Confidencial

Nivel 4: Restringido

Mapeo de niveles de datos al panorama de proveedores

El piso legal: GDPR Article 22 y la AI

Aplicación práctica: cómo hacerla funcionar sin hacerla dolorosa

Auditoría del cumplimiento

Qué leer a continuación

On this page