Classificação de Dados para Acesso de AI: Um Framework de 4 Camadas para CIOs

O incidente de governança de AI mais comum não é uma alucinação. É um funcionário colando PII de clientes, um contrato confidencial ou dados financeiros internos em uma ferramenta de AI pública. Isso acontece diariamente em empresas sem uma política de classificação de dados para AI.
Não porque os funcionários são descuidados. Porque ninguém lhes disse as regras. E as regras que eles têm, a política de classificação de dados da auditoria SOC 2, não foram escritas para AI.
Este artigo traz o framework de classificação de dados de 4 camadas específico para AI: quais categorias de dados podem entrar em quais camadas de ferramentas de AI, como mapear isso para o cenário de fornecedores, como é o piso legal sob o GDPR Article 22 e como impor isso sem tornar a AI inutilizável. É um complemento a Criando Sua Política de Uso de AI, onde este framework é operacionalizado.
Por que sua política de classificação de dados existente não é suficiente
Fatos Essenciais: Lacunas de Governança de Dados de AI
- 43% das organizações citam a qualidade e a prontidão dos dados como seu principal obstáculo ao sucesso de AI, mas as políticas de classificação de dados da maioria das organizações foram escritas antes que os sistemas de AI existissem e não abordam os três caminhos de exposição específicos de AI (Informatica, 2025)
- O GDPR Article 22 se aplica a sistemas de AI que tomam decisões automatizadas consequentes sobre indivíduos (crédito, contratação, acesso a serviços), e as ações de aplicação por violações do GDPR agora chegam a dezenas de milhões de euros para violações em escala empresarial na UE (EU Data Protection Board, 2025)
- Ferramentas de AI de nível consumidor (ChatGPT gratuito, contas pessoais do Claude) não têm DPAs formais, o que significa que quaisquer dados colados nelas não têm proteção contratual contra uso de treinamento ou retenção; estima-se que 78% dos funcionários usem essas ferramentas para o trabalho sem consciência desses termos (Microsoft, 2024)
A maioria das empresas com qualquer maturidade de governança tem uma política de classificação de dados. Ela veio com a auditoria SOC 2 ou a certificação ISO 27001. Define camadas como Pública, Interna, Confidencial e Restrita. Os funcionários devem lidar com cada camada adequadamente.
Mas essas políticas foram projetadas para um modelo de ameaça diferente. Assumiam que os dados permanecem em sistemas que você controla, compartilhados com humanos dentro ou fora da organização, protegidos por controles de acesso e criptografia.
Os sistemas de AI mudam o modelo de ameaça de três maneiras específicas que a maioria das políticas existentes não aborda. O NIST SP 800-60 é o padrão federal para mapear tipos de informação para categorias de segurança e fornece o framework fundamental para classificação de dados, mas é anterior aos sistemas de AI modernos e precisa ser estendido para levar em conta os caminhos de exposição específicos de AI.
Treinamento com input. Ferramentas de AI de nível consumidor, e algumas de nível empresarial com configurações padrão, podem usar seus inputs para treinar ou ajustar seus modelos. Se um funcionário colar um documento de estratégia confidencial em uma conta pública do ChatGPT, esse conteúdo pode se tornar parte dos dados de treinamento do modelo, acessível de forma fragmentada para qualquer pessoa que faça as perguntas certas. A classificação de dados tradicional assume que você está protegendo contra acesso não autorizado. O treinamento com input cria um tipo diferente de exposição: seus dados se tornam parte do próprio modelo. Isso também é por que IP e direitos autorais em outputs de AI é uma preocupação de governança adjacente.
Retenção e recuperação de prompts. Muitas ferramentas de AI retêm o histórico de conversas. Algumas o tornam acessível a outros usuários ou ao fornecedor para revisão de qualidade. Um representante de vendas que cola a discussão de budget de um prospect em uma ferramenta de AI para elaborar uma proposta pode deixar essa conversa acessível nos sistemas do fornecedor indefinidamente.
Roteamento de modelos de terceiros. Muitas ferramentas de produtividade de AI não executam seus próprios modelos. Elas roteiam seus prompts para OpenAI, Anthropic ou Google no backend. A questão de governança não é apenas sobre a ferramenta de AI que você vê. É sobre cada provedor de modelos na cadeia.
Sua política de classificação de dados existente provavelmente diz "dados Confidenciais devem ser criptografados em repouso e em trânsito." Isso está correto, mas insuficiente. Não diz nada sobre se dados Confidenciais podem ser enviados a um provedor de modelos de terceiros com ou sem um DPA. A política específica de AI preenche essa lacuna.
"Sua política de classificação de dados existente assume que os dados permanecem em sistemas que você controla. AI muda essa suposição de três maneiras: a ferramenta pode treinar com seus inputs, ela retém o histórico de conversas e pode rotear prompts para provedores de modelos de terceiros que você não analisou. Uma política que diz 'dados Confidenciais devem ser criptografados em repouso e em trânsito' não aborda nenhum desses três riscos." (Rework)
O Esquema de Acesso de Dados de AI de 4 Camadas
Um framework de classificação estruturado especificamente projetado para decisões de acesso de ferramentas de AI, estendendo a classificação de dados tradicional para levar em conta os caminhos de exposição específicos de AI (treinamento com input, retenção de prompts, roteamento de modelos de terceiros). Camada 1 (Pública): dados já públicos, permitidos em qualquer ferramenta aprovada. Camada 2 (Interna): dados operacionais de rotina, permitidos em ferramentas de AI empresariais com DPA assinado e compromisso de não treinamento. Camada 3 (Confidencial): PII de clientes, dados financeiros, contratos e IP, exige apenas implantações de AI em nuvem privada ou on-premise. Camada 4 (Restrita): dados cobertos por HIPAA, GLBA, biométricos e em hold de litígio, sem AI externa sem aprovação jurídica explícita e compromissos contratuais por escrito. O esquema mapeia camadas de dados para categorias de ferramentas, permitindo que os funcionários tomem decisões corretas de acesso de AI sem consultar documentos de política em cada interação.
O framework de classificação de dados de AI de 4 camadas
Este framework é projetado para responder a uma pergunta prática: esses dados podem entrar nessa ferramenta de AI?
Camada 1: Pública
Definição: Dados que já são públicos ou que não teriam impacto significativo nos negócios se tornados públicos.
Exemplos:
- Conteúdo do seu site público, blog e materiais de marketing
- Informações públicas de concorrentes (do site público, comunicados de imprensa, registros públicos)
- Conhecimento geral de negócios e do setor não específico da sua empresa
- Orientação regulatória pública e documentos de padrões
- Conteúdo de bases de conhecimento públicas, Wikipedia, pesquisa pública
Permissão de ferramenta de AI: Qualquer ferramenta de AI aprovada, incluindo ferramentas de nível consumidor e ferramentas sem DPA formal, pode processar dados da Camada 1.
Cadência de auditoria: Nenhuma auditoria específica necessária. Dados da Camada 1 por definição não têm sensibilidade a proteger.
Nota: Pública não significa "baixo risco para a tarefa". Uma equipe de marketing usando o comunicado de imprensa público de um concorrente como input para análise competitiva está usando dados da Camada 1, mesmo que o output de negócio seja importante. A classificação é sobre os dados de input, não a importância estratégica do trabalho.
Camada 2: Interna
Definição: Dados que não são públicos, mas que teriam impacto limitado nos negócios se divulgados. Inclui a maioria dos dados operacionais de rotina, documentação de processos internos e comunicações de negócios não sensíveis.
Exemplos:
- Documentação de processos internos e procedimentos operacionais padrão
- Notas de reuniões internas de rotina (sem conteúdo estratégico ou financeiro)
- Comunicações internas de funcionários não sensíveis
- Dados internos de gerenciamento de projetos sem conteúdo financeiro ou estratégico
- Descrições gerais de roadmap de produto que não incluem detalhes sensíveis à concorrência
- Dados de clientes agregados e anonimizados sem identificadores individuais
Permissão de ferramenta de AI: Dados da Camada 2 podem ser processados por ferramentas de AI de nível empresarial que têm:
- Um Data Processing Agreement (DPA) assinado com a empresa
- Um compromisso de não treinamento com o input no contrato empresarial
- Certificação SOC 2 Tipo II ou equivalente
Ferramentas que atendem a esses critérios incluem OpenAI Enterprise, Anthropic Claude for Business, Microsoft 365 Copilot (dentro do seu limite de conformidade M365) e Google Workspace com Gemini for Workspace.
Ferramentas de nível consumidor (ChatGPT gratuito, contas pessoais Claude.ai, contas pessoais Google Bard) não são aprovadas para dados da Camada 2.
Cadência de auditoria: Revisão trimestral dos contratos de ferramentas empresariais para confirmar que os termos do DPA ainda estão atuais e os compromissos de não treinamento ainda estão em vigor.
Camada 3: Confidencial
Definição: Dados cuja exposição causaria dano material aos negócios, legal ou reputacional. Exige a maior proteção para a maioria das operações de negócios.
Exemplos:
- PII de clientes (nomes, endereços de e-mail, números de telefone, endereços) em qualquer forma identificável
- Dados de uso, histórico de transações e detalhes de conta de clientes
- Contratos e acordos legais assinados
- Projeções, previsões financeiras e resultados não divulgados
- Materiais relacionados a M&A (listas de alvos, termos do negócio, due diligence)
- Propriedade intelectual, algoritmos proprietários e código-fonte com lógica sensível
- Dados pessoais de funcionários (registros de RH, avaliações de desempenho, remuneração)
- Comunicações privilegiadas entre cliente e advogado
- Materiais do conselho e documentos estratégicos de nível do conselho
Permissão de ferramenta de AI: Dados da Camada 3 exigem:
- Uma implantação de AI em nuvem privada com sua organização como único locatário, com dados que nunca saem do seu ambiente
- Uma implantação de AI on-premise rodando na sua própria infraestrutura
- Uma ferramenta de AI empresarial com garantias explícitas de residência de dados, servação de modelos air-gapped e um compromisso contratual de que os dados nunca são usados para treinamento ou acessíveis à equipe do fornecedor
Em 2026, a maioria das ferramentas de AI empresariais comerciais (incluindo OpenAI Enterprise, Anthropic Claude for Business e Microsoft Copilot) não são adequadas para dados da Camada 3 por padrão. Alguns oferecem opções de implantação privada a custo adicional. Verifique com a configuração específica do seu fornecedor.
Cadência de auditoria: Revisão mensal de quais funcionários processaram dados da Camada 3 por meio de qualquer workflow de AI, com relatório de exceções para quaisquer dados da Camada 3 que entraram em uma ferramenta aprovada para a Camada 2.
Nota sobre o GDPR: PII de clientes na Camada 3 está sujeita aos requisitos de tomada de decisão automatizada do GDPR Article 22 quando AI toma decisões consequentes sobre indivíduos. Veja a seção Piso Legal abaixo.
Camada 4: Restrita
Definição: Dados cuja exposição criaria consequências legais, financeiras ou de segurança graves. Exige revisão jurídica e de segurança explícita antes de qualquer uso de AI.
Exemplos:
- Dados médicos e de saúde cobertos por HIPAA (Health Insurance Portability and Accountability Act: registros de pacientes, históricos de tratamento, dados clínicos)
- Dados financeiros regulados cobertos por GLBA (Gramm-Leach-Bliley Act) ou regulamentações bancárias (decisões de empréstimo, dados de crédito, registros financeiros de nível de conta sujeitos a supervisão regulatória)
- Dados cobertos por regulamentações setoriais específicas com restrições explícitas de AI (dados de crianças sob o COPPA, certos registros educacionais sob o FERPA)
- Segredos de estado e dados relevantes para segurança nacional (relevante para contratados do governo)
- Dados em hold de litígio ativo ou sujeitos a uma ordem judicial
- Identificadores biométricos (impressões digitais, dados de reconhecimento facial, amostras de voz)
Permissão de ferramenta de AI: Nenhuma ferramenta de AI externa, incluindo ferramentas de nível empresarial, pode processar dados da Camada 4 sem aprovação escrita explícita do CISO e assessoria jurídica, compromissos contratuais específicos do fornecedor sobre tratamento de dados e documentação de por que nenhuma abordagem alternativa é viável.
Na maioria dos casos, a resposta adequada para dados da Camada 4 é AI on-premise sem transmissão de dados externos. Para setores regulados, consulte seu consultor de conformidade antes de qualquer uso de AI com dados da Camada 4.
Cadência de auditoria: Qualquer uso de AI da Camada 4 requer revisão e documentação caso a caso. Não há workflow de AI "de rotina" da Camada 4 que opere em auditoria agendada; cada instância é uma exceção.
Mapeando camadas de dados para o cenário de fornecedores
Esta tabela mapeia camadas de dados para categorias de ferramentas. Use-a como a árvore de decisão em sua política de uso de AI.
| Categoria de Ferramenta | Exemplos | Camada 1 | Camada 2 | Camada 3 | Camada 4 |
|---|---|---|---|---|---|
| AI Consumidor (sem DPA) | ChatGPT gratuito, Claude.ai pessoal, Gemini pessoal | Permitido | Não Permitido | Não Permitido | Não Permitido |
| AI Empresarial (DPA + SOC 2) | OpenAI Enterprise, Anthropic Claude for Business, Google Workspace + Gemini, Microsoft 365 Copilot | Permitido | Permitido | Não Permitido (padrão) | Não Permitido |
| AI em nuvem privada (locatário único) | Azure OpenAI Service (implantação privada), AWS Bedrock (isolado), GCP Vertex AI (isolado) | Permitido | Permitido | Permitido (com revisão de configuração) | Revisão caso a caso |
| AI on-premise | Llama, Mistral ou modelos ajustados implantados localmente no hardware da empresa | Permitido | Permitido | Permitido | Permitido (com revisão jurídica) |
Os cabeçalhos de coluna são as camadas de dados. Os valores das células indicam se essa categoria de ferramenta pode processar essa camada de dados. Leia a tabela como: "Posso usar esta categoria de ferramenta para dados nesta camada?"
Uma nota sobre configurações de "nuvem privada". Vários fornecedores de AI empresariais oferecem opções de implantação privada ou isolada onde seus dados permanecem em um ambiente dedicado, as chamadas de modelo nunca saem da sua região de nuvem e a equipe de operações do fornecedor não tem acesso aos seus dados. Essas configurações são caras e operacionalmente complexas, mas são a ponte entre ferramentas de nível empresarial e implantações on-premise para dados da Camada 3. Se o seu fornecedor oferece isso, obtenha os compromissos contratuais específicos (SLA de residência de dados, compromisso de não acesso operacional, acesso a logs de auditoria) por escrito antes de tratá-lo como aprovado para a Camada 3.
O piso legal: GDPR Article 22 e AI
Para empresas que operam na União Europeia ou que a atendem, o GDPR Article 22 estabelece o mínimo legal para tomada de decisão baseada em AI envolvendo dados pessoais.
O que o Article 22 diz. O GDPR Article 22 dá aos titulares de dados o direito de não ser sujeitos a decisões baseadas exclusivamente em processamento automatizado que produzam efeitos legais ou igualmente significativos. "Exclusivamente automatizado" significa nenhuma revisão humana significativa. "Efeitos legais ou igualmente significativos" inclui decisões de crédito, decisões de emprego, acesso a serviços e resultados consequentes semelhantes.
O que isso significa para os workflows de AI. Se sua AI toma uma decisão consequente sobre uma pessoa (uma pontuação de crédito, uma recomendação de contratação, uma atribuição de camada de serviço ao cliente, um scoring de leads que determina quem é contactado) e essa decisão é tomada sem revisão humana significativa, você tem uma questão de conformidade com o GDPR Article 22 para titulares de dados da UE.
A postura de conformidade prática. Qualquer workflow de AI Predict ou Execute que toma decisões consequentes sobre indivíduos identificáveis precisa de:
- Uma etapa de revisão humana no fluxo que seja genuinamente significativa (não uma aprovação automática)
- Uma base documentada para o processamento (interesse legítimo ou consentimento explícito)
- Um mecanismo para o indivíduo solicitar revisão humana e contestar o resultado
Isso não é um requisito específico de AI. Aplica-se a qualquer tomada de decisão automatizada sobre pessoas. Mas AI aumentou dramaticamente o volume e a sofisticação das decisões automatizadas que as empresas tomam, o que significa que a conformidade com o GDPR Article 22 é agora uma preocupação ativa de governança para qualquer empresa que faça trabalho significativo de AI com dados de clientes ou funcionários.
CCPA (Califórnia). A Lei de Privacidade do Consumidor da Califórnia dá aos consumidores direitos sobre tomada de decisão automatizada envolvendo suas informações pessoais. As empresas sujeitas ao CCPA devem garantir que seus workflows de AI envolvendo consumidores da Califórnia incluam divulgação adequada e mecanismos de opt-out consistentes com os Regulamentos CCPA efetivos em março de 2025.
HIPAA. Qualquer processamento de AI de informações de saúde protegidas (PHI) requer um Business Associate Agreement (BAA) com o fornecedor de AI. PHI é Camada 4 por padrão. Se o seu fornecedor não consegue assinar um BAA, PHI não pode entrar em sua ferramenta.
GLBA. Instituições financeiras sujeitas ao Gramm-Leach-Bliley Act devem garantir que as ferramentas de AI que processam informações financeiras de clientes atendam aos requisitos da Regra de Salvaguardas para proteger os dados dos clientes.
Aplicação prática: funcionando sem tornar tudo doloroso
Os frameworks de classificação falham não porque são mal projetados, mas porque são impossíveis de seguir na prática. Veja como fazer este funcionar de verdade.
Rotule os dados na origem. Integre rótulos de camada nos sistemas onde os dados vivem. Bibliotecas de documentos do SharePoint com rótulos de sensibilidade. Campos de CRM marcados por camada de dados. Sistemas de gerenciamento de contratos com metadados de classificação. Quando os dados são rotulados onde vivem, os funcionários não precisam se lembrar das regras de classificação. A ferramenta os informa.
Modelos de prompt que impõem a classificação. Para equipes que usam ferramentas de AI intensamente, forneça modelos de prompt aprovados que pré-classificam o input. Um modelo de equipe de vendas para elaboração de propostas que diz "Insira apenas informações internas sobre sua empresa aqui" lembra aos usuários qual camada é adequada sem exigir que eles consultem um documento de política no meio de uma tarefa.
Treinamento ancorado em exemplos reais. O treinamento de classificação que dá aos funcionários cenários reais do seu trabalho é mais eficaz do que regras abstratas. "Quando você está colando este contrato de cliente no assistente de elaboração, esses são dados da Camada 3, o que significa que a ferramenta de AI do contrato deve ser nossa implantação on-premise, não o ChatGPT Enterprise." O concreto supera o abstrato.
Revisão de padrões de incidentes. A maioria das violações de classificação não é deliberada. São o resultado de funcionários que não sabem ou não pensam sobre a regra no momento relevante. Revise os padrões de incidentes trimestralmente: quais tipos de dados estão indo para onde, onde as violações se concentram, se equipes ou ferramentas específicas são de maior risco. Use os padrões para refinar o treinamento, não apenas para atribuir culpa.
Tratamento de exceções. Às vezes um caso de uso da Camada 3 emerge com uma necessidade legítima de negócio e poderia ser abordado com a opção de implantação privada de um fornecedor. Construa um processo de exceção: solicitação, revisão do CISO, verificação de compromisso contratual específico, aprovação por tempo limitado. Ter um caminho formal de exceção evita que as equipes sejam bloqueadas ou ajam de forma independente.
Auditando conformidade
Registre o que entra. Ferramentas de AI empresariais com DPAs devem fornecer logs de auditoria dos inputs de prompt e do funcionário que os enviou. Ative isso. Revise os logs trimestralmente para conteúdo da Camada 3 ou Camada 4 em ferramentas não aprovadas para essas camadas.
Verificação pontual de funções de alto risco. Funções que regularmente lidam com dados da Camada 3 ou Camada 4 (finanças, jurídico, RH, vendas com amplo acesso a contratos) justificam monitoramento mais próximo. Verificações pontuais trimestrais revisando logs de uso de ferramentas de AI em relação às regras de camada de dados.
Análise de relato de incidentes. Cada incidente de AI relatado deve ser avaliado quanto às implicações de classificação de dados. O incidente foi causado por dados da Camada 3 em uma ferramenta da Camada 2? Essa é uma lacuna de imposição de classificação. Foi causado pelo uso de uma ferramenta não aprovada? Essa é uma lacuna de shadow AI. Categorize os incidentes para identificar problemas sistêmicos versus erros únicos.
Revisão anual completa. Os tipos de dados mudam conforme o negócio evolui. Novas fontes de dados são adicionadas. Os requisitos regulatórios mudam. Revise a lista completa de atribuição de camadas anualmente para garantir que a classificação ainda corresponda aos dados de negócio atuais e aos requisitos regulatórios atuais.
A classificação diz a você quais dados podem ir para onde. Mas o problema mais difícil é saber o que fazer quando um workflow de AI toca dados classificados e algo dá errado, que é a pergunta que o processo de portões de aprovação e revisão de fornecedores deve responder primeiro.
Análise Rework: Com base em padrões de incidentes de governança de dados de AI, a violação mais frequente é dados da Camada 3 (PII de clientes, contratos, projeções financeiras) processados em ferramentas aprovadas para a Camada 2 (ChatGPT empresarial, Claude for Business), não em ferramentas de nível consumidor. Isso ocorre porque os funcionários corretamente evitam ferramentas de consumidor, mas não percebem que sua ferramenta de nível empresarial não é aprovada para dados da Camada 3 em sua configuração padrão. Os dados da Camada 3 exigem implantação em nuvem privada (com compromissos contratuais específicos) ou AI on-premise. A tabela de mapeamento de fornecedores neste artigo é especificamente projetada para tornar a fronteira Camada 2/Camada 3 visível, em vez de assumir que os funcionários lerão as letras pequenas nos contratos empresariais.
O que ler a seguir
Leia: Criando Sua Política de Uso de AI para a estrutura de política de 6 seções que operacionaliza este framework de classificação.
Leia: Portões de Aprovação de AI e Revisão de Fornecedores para o checklist de avaliação de fornecedores que determina em qual camada de ferramenta um novo produto de AI se enquadra.
Leia: Registro de Risco de AI: O Que Rastrear para como as violações de classificação de dados se encaixam no seu rastreamento mais amplo de risco de AI.
Leia: Os 7 Tipos de Dados que Alimentam AI de Negócios para entender quais tipos de dados alimentam as capacidades de AI e quais carregam os maiores requisitos de governança.
Veja também:
- Trilhas de Auditoria para Ações Execute de AI: os requisitos de logging para workflows de AI com capacidade Execute que lidam com dados classificados
- Prontidão de Dados: O Pré-Requisito que a Maioria dos Projetos de AI Ignora: entendendo a qualidade dos dados antes que as regras de acesso de AI possam ser aplicadas

Co-Founder & CMO, Rework
On this page
- Por que sua política de classificação de dados existente não é suficiente
- O Esquema de Acesso de Dados de AI de 4 Camadas
- O framework de classificação de dados de AI de 4 camadas
- Camada 1: Pública
- Camada 2: Interna
- Camada 3: Confidencial
- Camada 4: Restrita
- Mapeando camadas de dados para o cenário de fornecedores
- O piso legal: GDPR Article 22 e AI
- Aplicação prática: funcionando sem tornar tudo doloroso
- Auditando conformidade
- O que ler a seguir