Português

Arquivamento de Longo Prazo de Dados Legados do CRM: O Que Manter e Como

Uma empresa migrou do Salesforce em 2021. A migração foi bem. O novo CRM estava funcionando. Mas ninguém tomou a decisão sobre o que fazer com a organização antiga do Salesforce.

Dois anos depois, ainda pagavam as licenças do Salesforce. Vinte licenças a $150/mês cada: $36.000 por ano de acesso read-only a dados históricos que três pessoas na empresa haviam consultado nos últimos seis meses. O motivo pelo qual não havia sido cancelado: "Não temos certeza do que tem lá que possamos precisar."

Um incidente de governança de dados em 2023 (uma solicitação de exclusão por GDPR que exigiu encontrar e excluir registros em todos os sistemas) finalmente forçou a decisão. A empresa passou três semanas auditando a organização do Salesforce, descobriu que a maior parte era redundante com o novo CRM, exportou o que não era e cancelou. O custo total da espera: $72.000 em taxas de licença desnecessárias, três semanas de tempo de TI e uma resposta ao GDPR que levou 14 dias em vez de 2.

A decisão de arquivamento que deveria ter acontecido em 2021 aconteceu em 2023. Este guia é essa decisão, tomada no momento certo. Ele parte de onde a auditoria de dados pós-migração termina: assim que as auditorias de 72 horas e 30 dias confirmam que o novo CRM está completo, o papel do sistema de origem muda de rede de segurança de rollback para arquivo histórico.


O Que Você É Legalmente Obrigado a Manter

Antes de decidir o que arquivar, entenda o que você é legalmente obrigado a reter. A resposta varia por região, setor e tipo de registro.

GDPR (União Europeia e Reino Unido):

O GDPR cria uma tensão que muitas empresas não resolvem completamente: o direito ao esquecimento (pessoas podem solicitar a exclusão de seus dados) versus as obrigações de retenção legítima (você pode precisar de certos dados por razões legais ou contratuais). O artigo do Wikipedia sobre GDPR cobre as disposições do direito ao esquecimento (Artigo 17) e as exceções para retenção por obrigação legal, ambas as quais afetam diretamente quais dados arquivados do CRM você deve poder excluir sob demanda.

Na prática, para dados de CRM:

  • Você pode reter dados em que tenha interesse comercial legítimo (relacionamento ativo com cliente, obrigação contratual)
  • Você deve excluir dados mediante solicitação de exclusão, com exceções limitadas
  • Os períodos de retenção devem ser definidos: "mantemos indefinidamente" não está em conformidade com o GDPR
  • Você deve ser capaz de demonstrar que os dados legados arquivados estão incluídos no seu mapa de dados (ou seja, se alguém enviar uma solicitação de exclusão, você deve ser capaz de encontrar e excluir os registros deles no arquivo também)

Retenção de dados nos EUA:

Não existe uma única lei federal de retenção de dados de CRM, mas regras específicas por setor se aplicam:

  • Serviços financeiros (SEC Rule 17a-4): certos registros comerciais devem ser retidos por 3 a 7 anos em formato não apagável
  • Saúde (HIPAA): se o seu CRM contém PHI, as regras de retenção são rígidas e os procedimentos de exclusão devem ser documentados
  • Califórnia (CCPA): os consumidores têm direitos de exclusão semelhantes ao GDPR; seu arquivo deve suportar essas solicitações de exclusão

As diretrizes do NIST sobre retenção e descarte de dados fornecem um framework neutro em tecnologia para definir períodos de retenção e procedimentos de exclusão segura, úteis como referência de conformidade independentemente dos regulamentos específicos do setor que se aplicam ao seu negócio.

Registros comerciais gerais:

Dados relacionados a contratos (termos de negócio, acordos assinados, comunicações com clientes em torno de negociações contratuais) geralmente se enquadram na retenção de registros comerciais gerais, tipicamente 7 anos nos EUA e na UE para registros financeiros.

Quem toma essa decisão:

Jurídico ou conformidade, com contribuição de TI e RevOps. Esta não é uma decisão unilateral de TI. Obtenha um memorando assinado pelo jurídico ou pela conformidade especificando seus períodos de retenção por tipo de registro antes de arquivar qualquer coisa. Os tipos de registro sobre os quais você está tomando decisões de retenção aqui se sobrepõem diretamente ao escopo definido em como tratar atividades históricas, notas e e-mails: o que você escolheu migrar, arquivar ou descartar no momento da exportação determina quais categorias agora precisam de tratamento formal de retenção.


O Framework de Decisão de Retenção

Com a base legal compreendida, aplique uma política de retenção por tipo de registro.

Modelo de política de retenção:

Tipo de registro Retenção recomendada Justificativa
Negócios fechados como ganhos (dados de contrato, termos do negócio) Mínimo de 7 anos Registros comerciais, contratos auditáveis
Negócios fechados como perdidos 3 anos Análise de Pipeline, referência competitiva
Contatos ativos no momento da migração 3 anos após a migração Referência de relacionamento comercial em curso
Contatos inativos (sem engajamento por 2+ anos) 1 ano após a migração, depois excluir Sem interesse legítimo após o esquecimento
Logs de atividade: notas inseridas por representantes 3 anos Contexto de relacionamento, resolução de disputas
Logs de atividade: eventos gerados pelo sistema Máximo de 1 ano Baixo sinal; sem obrigação de retenção
Metadados de e-mail (assunto, data, remetente) 2 anos Suficiente para a maioria das necessidades de referência
Conteúdo do corpo do e-mail 3 anos para e-mails relacionados a negócios Referência de contrato/disputa
Snapshots de relatórios personalizados 5 anos Registros de desempenho empresarial
Logs de acesso de usuário e auditoria 3 a 5 anos Requisitos de segurança e conformidade

Quem decide:

Jurídico ou conformidade aprova os períodos de retenção. RevOps propõe os tipos de registro e a justificativa comercial. TI é responsável pela implementação (qual formato, onde armazenar, como acessar).

Documente a decisão formalmente. Uma política de retenção não precisa ser um documento de 50 páginas, mas precisa existir como um registro escrito que foi revisado e aprovado. Se um regulador perguntar sobre suas práticas de retenção de dados daqui a dois anos, "discutimos em uma reunião" não é uma resposta.


Escolhendo um Formato de Arquivo

O formato do arquivo determina o que você pode fazer com os dados depois. Otimize para: portabilidade (legível sem o sistema de origem), capacidade de consulta (alguém pode pesquisar?) e custo.

Opção A: Exportação CSV + JSON

Exporte todos os objetos como arquivos CSV planos (um arquivo por objeto) mais quaisquer dados de relacionamento como JSON ou tabelas de junção separadas. Armazene com um dicionário de dados que mapeia cada coluna para um nome de campo e tipo.

Prós: Qualquer ferramenta pode ler. Sem dependência de fornecedor. Fácil de auditar para solicitações de exclusão. Pode ser aberto no Excel, Sheets ou qualquer ferramenta de dados.

Contras: A consulta requer carregar em um banco de dados ou usar ferramentas de spreadsheet. Os relacionamentos entre objetos requerem joins manuais.

Ideal para: A maioria dos times. Simples, durável, portátil.

Opção B: Dump de banco de dados

Um backup completo do banco de dados subjacente do CRM de origem (se o fornecedor disponibilizar um).

Prós: Pode ser restaurado para uma instância nova se necessário. Preserva todos os relacionamentos nativamente.

Contras: O formato é frequentemente proprietário ou específico de versão. A restauração requer infraestrutura compatível. Não é legível por humanos sem ferramentas.

Ideal para: Times com capacidade de TI que desejam a opção de restaurar temporariamente o sistema de origem (por exemplo, para uma grande solicitação de descoberta legal).

Opção C: Data warehouse em nuvem (BigQuery, Redshift, Snowflake)

Exporte os dados do CRM para um data warehouse estruturado em nuvem onde podem ser consultados via SQL.

Prós: Totalmente consultável. Trata solicitações de exclusão via SQL DELETE. Escalável. Pode ser conectado a ferramentas de BI.

Contras: Requer configuração de infraestrutura em nuvem e manutenção contínua. Exagero para a maioria dos times com menos de 100.000 contatos.

Ideal para: Times que já usam um data warehouse e desejam que o histórico do CRM faça parte dele.

Opção D: Exportação gerenciada SaaS para nuvem (Salesforce Data Archive, ferramentas de arquivamento do HubSpot)

Alguns fornecedores oferecem arquivamento nativo que move dados mais antigos para camadas de armazenamento mais baratas, mantendo-os consultáveis pela plataforma.

Prós: Permanece na interface familiar da plataforma. Esforço mínimo de migração.

Contras: Ainda requer licenciamento do fornecedor. Não desativa de fato o sistema de origem. Não resolve o problema de "estamos pagando por um sistema que não usamos".

Ideal para: Empresas que precisam de uma solução de arquivo de curto prazo enquanto planejam uma desativação completa.

Comparação de formatos de arquivo:

Formato Portabilidade Capacidade de consulta Custo Complexidade
CSV + JSON Alta Baixa (manual) Quase zero Baixa
Dump de banco de dados Baixa (proprietário) Baixa (requer restauração) Baixa Média
Data warehouse em nuvem Alta Alta (SQL) Baixo a médio (somente armazenamento) Média
Exportação gerenciada SaaS Média Média Média (licenciamento) Baixa

Opções de Armazenamento e Custo

Depois de escolher um formato de arquivo, decida onde ele ficará.

Armazenamento frio (AWS Glacier, Azure Archive, Google Coldline):

  • Custo: ~$0,004/GB/mês (AWS Glacier Deep Archive)
  • Tempo de recuperação: Horas a dias
  • Ideal para: Dados que você pode precisar para questões legais/conformidade, mas não espera acessar regularmente
  • Custo de recuperação: $0,02/GB para expedido; menor para padrão

Para uma exportação de CRM de 100 GB (típica para um CRM de 5 anos com 100.000 contatos), o armazenamento frio custa cerca de $0,40/mês. Um arquivo de 5 anos custa aproximadamente $24 em armazenamento. Não é erro de digitação.

Armazenamento padrão em nuvem (AWS S3, Azure Blob, Google Cloud Storage):

  • Custo: ~$0,023/GB/mês (AWS S3 Standard)
  • Recuperação: Imediata
  • Ideal para: Dados acessados ocasionalmente (mensal ou trimestralmente)
  • Bom equilíbrio entre custo e velocidade de acesso

Data warehouse em nuvem (BigQuery, Redshift, Snowflake):

  • Custo de armazenamento: ~$0,02/GB/mês (BigQuery)
  • Custo de consulta: Adicional por TB verificado
  • Ideal para: Dados consultados regularmente (semanalmente) ou que precisam suportar pesquisas self-service

On-premises:

  • Custo: Despesa de capital para hardware + manutenção de TI
  • Acesso: Imediato
  • Ideal para: Organizações com infraestrutura on-premises existente e requisitos fortes de soberania de dados
  • Contras: Carga de manutenção; risco de falha de hardware

Para a maioria das empresas que migram de um CRM de médio porte:

O armazenamento frio é o padrão correto para dados com mais de 2 anos. Armazenamento padrão em nuvem para dados dos últimos 2 anos que possam ser referenciados. Data warehouse somente se você já estiver executando um e o custo incremental for mínimo.


Construindo um Caminho de Acesso para o Time de Vendas

Os representantes vão pedir registros antigos. Construa um processo antes que o primeiro pedido chegue.

O volume realista de solicitações:

Nos primeiros 30 dias após a migração, espere de 5 a 15 solicitações por 50 representantes. Após 90 dias, cai para 1 a 3 por mês. Após 6 meses, quase nada. Planeje para alto volume no início, depois volume baixo em estado estável.

Opções de acesso, classificadas por praticidade:

Opção 1: Manter o sistema de origem read-only por 90 dias

A abordagem mais simples. Não desative imediatamente. Dê aos representantes acesso direto read-only ao CRM antigo por 90 dias. Depois disso, o volume de solicitações cai o suficiente para que um processo de consulta manual o atenda.

Custo: Um trimestre de taxas de licença. Para 20 usuários a $75/mês read-only: $4.500. Vale a pena para a maioria dos times evitar construir um sistema de acesso paralelo. Este período de 90 dias read-only também é o que torna o planejamento de rollback viável: não inicie o processo de desativação até ter certeza de que o novo CRM está totalmente validado e a janela de rollback foi encerrada.

Opção 2: Enviar uma solicitação para TI

Após o término do período read-only, "enviar uma solicitação" se torna o caminho de acesso. O representante envia um e-mail para ops ou TI com o nome do contato e o motivo. TI consulta o arquivo e responde em até 24 horas.

Isso funciona em baixo volume (menos de 5 solicitações por mês). Não escala se as solicitações permanecerem altas.

Opção 3: Consulta de arquivo self-service (para times técnicos)

Uma UI web leve ou ferramenta de consulta de banco de dados que os representantes podem usar para pesquisar o arquivo por nome de contato ou e-mail. Requer tempo de configuração, mas reduz a carga de TI em escala.

Realista para: Times com uma ferramenta de BI já disponível (Tableau, Looker, Metabase) onde o arquivo pode ser adicionado como fonte de dados.


Desativando o Sistema de Origem de Forma Limpa

A desativação é o último passo e o que cria problemas quando é feita às pressas.

Checklist de desativação:

  • Exportação do arquivo verificada e validada (contagens de linhas correspondem à origem, registros de amostra legíveis)
  • Política de retenção aprovada pelo jurídico/conformidade
  • Todas as integrações ativas apontando para o CRM de origem identificadas e redirecionadas ou desativadas
  • Configuração de SSO/SAML atualizada (remover o CRM antigo do provedor de identidade)
  • Qualquer sincronização de e-mail ou calendário conectada ao CRM antigo desconectada
  • Chaves de API e tokens OAuth emitidos pelo CRM antigo revogados ou rotacionados nos sistemas conectados
  • Cancelamento do contrato com o fornecedor enviado com o período de aviso correto (tipicamente 30 dias)
  • Documentação interna atualizada (runbooks, documentos de TI que referenciam o sistema antigo)
  • Mapa de dados atualizado para remover o CRM antigo (especialmente importante para a documentação de conformidade com o GDPR)
  • Backup final realizado no dia do cancelamento (precaução adicional)

Cronograma de cancelamento:

A maioria dos fornecedores de CRM exige 30 dias de aviso por escrito antes do fim do período de cobrança. Verifique seu contrato. Perder a janela de cancelamento por um dia pode significar mais um ciclo de cobrança completo.

As integrações são o ponto de falha mais comum na desativação. Uma ferramenta interna que ainda faz chamadas de API para o CRM antigo começará a apresentar erros no dia após a desativação. Audite todas as integrações antes de cancelar. Uma pesquisa simples pelo nome de domínio do CRM antigo nos repositórios de código, nos workflows do Zapier e nas ferramentas de automação geralmente revela conexões que ninguém lembrava. Essa auditoria também confirma que a sincronização de e-mail e calendário foi totalmente redirecionada para o novo CRM antes de o sistema legado ficar offline.


Armadilhas Comuns

Arquivamento em formato proprietário que só o fornecedor consegue ler. Se o seu arquivo é uma exportação formatada pelo Salesforce que só pode ser interpretada pelas ferramentas do Salesforce, você estará pagando ao Salesforce indefinidamente. Archive em formatos abertos: CSV, JSON, SQL ou um formato de banco de dados padrão. A pesquisa de consultoria de governança de dados da PwC recomenda formatos abertos neutros em relação a fornecedores para retenção de dados de longo prazo como parte de uma governança de dados responsável, garantindo que os dados arquivados permaneçam acessíveis e auditáveis independentemente dos relacionamentos com fornecedores.

Manter o sistema de origem ativo além de sua utilidade de retenção. Os custos se acumulam silenciosamente. Defina uma data de desativação antes de a migração ser concluída. Coloque no plano do projeto. Trate como uma entrega.

Não documentar onde o arquivo está e como acessá-lo. Daqui a dois anos, a pessoa que gerenciou a migração pode não estar mais lá. Documente a localização do arquivo, as credenciais de acesso e o processo de consulta em um lugar que sobreviva à rotatividade de funcionários.

Esquecer as chaves de API e integrações vinculadas ao sistema legado. Toda ferramenta que estava conectada ao CRM antigo (sincronização de e-mail, automação de marketing, enriquecimento de dados) precisa ser auditada antes da desativação. Um workflow do Zapier esquecido que envia um e-mail de confirmação para novos contatos via API do CRM antigo vai parar de funcionar no dia após o cancelamento, e pode não ser percebido por semanas.


O Que Fazer a Seguir

Conclua o documento de política de retenção e a decisão de formato de arquivo antes da marca de 90 dias após a migração. A janela entre "migração concluída" e "desativação concluída" é tipicamente de 90 a 180 dias. Use bem esse tempo.

O arquivo se conecta diretamente ao tratamento de atividades históricas, notas e e-mails, especificamente os registros que você decidiu arquivar em vez de migrar. Esses registros precisam ser localizáveis no arquivo quando os representantes os solicitarem.

E a auditoria de dados pós-migração é um bom gatilho para iniciar a decisão de arquivamento: assim que as auditorias de 72 horas e 30 dias confirmam que o novo CRM está completo, o papel do sistema de origem muda de "backup em caso de rollback" para "arquivo de dados históricos". Esse é o momento de iniciar o processo de desativação.

Para o planejamento de rollback, observe que, uma vez que você tenha iniciado a desativação do sistema de origem, o rollback não é mais uma opção. Não inicie o processo de desativação até ter certeza de que o novo CRM está totalmente validado.


Saiba Mais