De acordo com uma pesquisa da McKinsey, 88% das empresas já utilizam Inteligência Artificial (IA), mas apenas 1% alcançou um nível de maturidade. A lacuna entre a experimentação inicial com ferramentas como o ChatGPT e a implementação de um sistema corporativo robusto é frequentemente preenchida por preocupações com a segurança de dados e a conformidade com regulamentações como a Lei Geral de Proteção de Dados (LGPD) no Brasil, ou a 152-FZ na Rússia. Este artigo detalha três abordagens arquitetônicas eficazes para corporações e compartilha a jornada de dois anos da Alpina Digital, que transitou por todas elas.
Jemal Khamidun, Head of AI na Alpina Digital e CPO da AlpinaGPT, destaca que a principal barreira para a adoção em larga escala da IA não é a tecnologia em si, nem o custo, mas sim a segurança da informação e a conformidade legal. Empresas frequentemente se deparam com o bloqueio de Modelos de Linguagem Grandes (LLMs) externos por parte de seus departamentos de segurança. A experiência da Alpina Digital, que implementa IA em seu próprio negócio de publicação de livros e em clientes de diversos setores (editorias, farmacêutico, varejo), oferece um panorama valioso sobre como superar esses desafios, desde os primeiros pilotos até a operação industrial dentro do ambiente do cliente.
Por que a maioria dos pilotos de IA não chega à produção?
A situação típica envolve o lançamento de um piloto de IA, com alguns departamentos experimentando LLMs e gerando demonstrações impressionantes. No entanto, o projeto frequentemente estagna. A pesquisa da McKinsey aponta que apenas 1% das empresas atingiu a maturidade, onde as redes neurais operam como parte integrante do ambiente de produção, e não como ferramentas de entusiastas. Isso significa que 87 de 88 empresas falham em transitar da fase de experimentação para a implementação efetiva. O principal impedimento não é a qualidade ou o preço dos modelos, que são hoje mais do que suficientes e acessíveis. O verdadeiro obstáculo reside na segurança da informação e na conformidade com a legislação: para onde vão os dados dos funcionários, como garantir a conformidade com leis de proteção de dados, como proteger segredos comerciais e como convencer o departamento de segurança de que um ambiente externo é seguro. A Alpina Digital percebeu que a pergunta mais crucial para o mercado não era "qual modelo é melhor?", mas sim "como obter a aprovação do CISO (Chief Information Security Officer)?". Essa questão deve ser o ponto de partida para qualquer projeto de implementação de IA corporativa, abordando pontos como a localização física dos dados, o acesso aos mesmos, o treinamento dos modelos com dados corporativos, o armazenamento e administração de históricos de chat, e a conformidade com leis e políticas internas.
"Einstein com Demência": Como funciona o acesso a LLMs estrangeiras
Para discutir segurança de forma concreta, é essencial entender como o acesso a modelos como os da OpenAI, Anthropic ou Google funciona tecnicamente. Muitos receios e mitos surgem da confusão entre duas formas distintas de interagir com LLMs: através da interface do usuário (como o aplicativo ChatGPT ou Claude.ai) e através de chaves de API. Estes são produtos diferentes com regras de processamento de dados distintas. Uma analogia precisa seria a seguinte: imagine um "Einstein" muito inteligente (o modelo) sentado atrás de uma porta fechada, acessível apenas com uma chave. O provedor de IA possui muitos desses "Einsteins" atrás de portas diferentes. Uma empresa adquire uma chave de API, permitindo abrir a porta, fazer uma pergunta e receber uma resposta. No entanto, este "Einstein" tem "demência": seu cérebro é genial, mas não tem memória. Ele responde à solicitação, esquece-a e segue em frente. A solicitação do usuário não permanece "em sua cabeça", não é usada para retreinamento e não entra em um espaço vetorial comum. É assim que funciona o acesso via API: ele é regido por contratos públicos dos provedores e não retreina o modelo com as solicitações. Por outro lado, quando um funcionário baixa o aplicativo ChatGPT em seu laptop e o utiliza pessoalmente, o modelo nessa interface é retreinado com dados do usuário, forma uma memória local e, se alguém invadir sua conta, terá acesso a todas as conversas, arquivos e fotos que o funcionário enviou. A maioria dos temores sobre "vazamentos no ChatGPT" se refere a este cenário, e não ao acesso via API.
Desta analogia simples, surge uma primeira conclusão prática: proibir o uso pessoal do ChatGPT pelos funcionários é correto, mas insuficiente. Se nenhuma alternativa for oferecida, eles continuarão a usá-lo secretamente, pois as tarefas não desaparecem. A arquitetura corporativa deve oferecer uma alternativa: os mesmos "cérebros" (modelos), mas através de um canal controlado.
Abordagem 1: Modelos estrangeiros via Gateway Corporativo de API
A primeira abordagem arquitetônica é a mais rápida de instalar. A empresa obtém acesso a modelos estrangeiros (GPT, Claude, Gemini) através de um gateway corporativo com chaves de API em vez de assinaturas pessoais. As solicitações são roteadas através de hubs em jurisdições amigáveis, enviando tráfego de API anonimizado para o provedor, sem vínculo com o funcionário. O histórico de chats permanece na Rússia (ou no país de origem da empresa) nos servidores do serviço, e o retreinamento do modelo com dados corporativos não ocorre. Legal e tecnicamente, esta é uma situação completamente diferente do uso de uma conta pessoal do ChatGPT, embora à primeira vista pareça o mesmo.
Esta abordagem é adequada para empresas onde a qualidade das respostas é crítica, mas a localização física do modelo não é. Isso é típico para redações, marketing, análise, P&D, equipes de produto – onde se trabalha com informações públicas, dados abertos, conceitos e ideias, e não com dados pessoais de cidadãos ou segredos de estado. As condições de aplicabilidade incluem: a política interna da empresa permite o processamento dessas classes de dados no exterior, e o departamento de segurança está preparado para realizar uma auditoria e assinar a solução arquitetônica. A abordagem não é adequada para bancos e seguradoras com grandes volumes de dados pessoais, empresas estatais, defesa, ou desenvolvedores de infraestrutura crítica, que necessitam das outras duas opções.
| Parâmetro | ChatGPT/Claude Pessoal | Gateway Corporativo via API | Retreinamento com dados | Sim | Não (por contrato do provedor) |
|---|---|---|---|---|---|
| Onde o histórico é armazenado | Na conta do provedor | No perímetro do serviço na Rússia | Visibilidade para SOC/DLP | Nula | Completa (logs, auditoria) |
| Acesso ao chat do funcionário | Apenas do funcionário | Por papéis + admin da empresa | |||
| Controle de papéis e acessos | Não | Sim (RBAC) | |||
| Conformidade com 152-FZ | Não previsto | Alcançável com configuração correta |
Abordagem 2: Modelos russos e Open-Source On-Premise
A segunda abordagem envolve a localização completa. Os modelos são implantados nos servidores da empresa, e os dados nunca saem do perímetro. Existem duas opções aqui: modelos comerciais russos (YandexGPT, GigaChat) ou modelos open-source implantados em GPUs próprias (Llama da Meta, Mistral, Qwen da Alibaba, DeepSeek). Legalmente, é impecável, atende à 152-FZ sem ressalvas e passa pelas auditorias do departamento de segurança sem problemas.
O preço desta abordagem é um compromisso na qualidade. Modelos russos estão evoluindo rapidamente, mas em benchmarks abertos, ainda ficam atrás de GPT e Claude em tarefas complexas de raciocínio, geração de código e trabalho com contexto longo. Modelos open-source se aproximam dos líderes, mas exigem infraestrutura séria: para o funcionamento adequado de modelos de 70B, são necessárias GPUs de classe A100/H100 ou várias RTX 4090, uma equipe dedicada de MLOps, monitoramento e atualizações. Esta abordagem é justificada para o processamento de dados sensíveis que, em princípio, não podem sair do perímetro – registros médicos, transações financeiras, correspondências confidenciais, códigos-fonte sob NDA. Também é indicada para empresas onde o departamento de segurança categoricamente não aceita arquiteturas com API externo em qualquer forma. A limitação real deste caminho é o custo de propriedade: apenas as GPUs custam milhões, além dos salários da equipe, eletricidade e refrigeração.
| Tipo de Modelo | Qualidade | Custo de Propriedade | Conformidade com 152-FZ | GPT / Claude (via API) | Nível Top | Baixo (apenas tokens) | Via gateway corporativo |
|---|---|---|---|---|---|---|---|
| YandexGPT / GigaChat | Médio | Médio (licenças) | Completa | ||||
| Open-source 70B+ on-prem | Alto | Muito Alto (GPU, MLOps) | Completa | ||||
| Open-source 7-13B on-prem | Médio | Médio (uma GPU) | Completa |
Abordagem 3: Arquitetura Híbrida – o que escolhemos no final
A terceira abordagem surge da compreensão de que diferentes tarefas têm diferentes sensibilidades aos dados. Gerar uma ilustração para uma apresentação não envolve dados confidenciais; requer qualidade máxima e é ideal para um modelo estrangeiro de ponta via API. Processar um manuscrito de autor ainda não publicado é um segredo comercial e exige um modelo local dentro do perímetro. Resumir um relatório público de vendas pode ser feito via API, mas resumir uma base de clientes com dados pessoais só pode ser feito on-premise.
A arquitetura híbrida funciona da seguinte forma: uma única interface para o usuário, e por baixo, um roteador de solicitações que, com base na política da empresa, envia a solicitação para a API externa, para um modelo on-premise local, ou a bloqueia até a decisão de um funcionário. Antes do modelo, há uma camada de pré-moderação: um agente que verifica a solicitação em busca de confidencialidade. Se sinais de dados sensíveis (nomes, números de conta, extratos de CRM) forem encontrados no texto, a solicitação é automaticamente redirecionada para o modelo local ou devolvida ao usuário com um aviso.
Nós, da Alpina Digital, levamos dois anos para chegar a essa arquitetura e a transformamos em um produto para evitar ter que reconstruí-la para cada cliente. O AlpinaGPT é essa plataforma: uma interface única para os funcionários, com roteamento de solicitações entre API externa e modelo local de acordo com a política da empresa, pré-moderação antes do envio ao modelo, integração DLP, acesso baseado em papéis e chats dentro do perímetro do cliente. Ele pode ser implantado na nuvem para equipes onde a API externa é permitida, ou on-premise para requisitos de segurança mais rigorosos. Até hoje, mais de 40 implementações corporativas em farmacêutica, varejo, fintech e mídia passaram por esta arquitetura.
O híbrido tem uma desvantagem honesta: é mais complexo de projetar. É preciso classificar os dados desde o início, descrever as políticas de roteamento, alinhá-las com o departamento de segurança, escolher um modelo local adequado à carga de trabalho e garantir SLAs para ambas as camadas. Não se trata de um MVP rápido "em duas semanas", mas de um projeto arquitetônico completo de 2 a 4 meses. Em troca, a empresa obtém uma solução onde nenhuma das abordagens 1 ou 2 funciona isoladamente: a qualidade dos modelos de ponta onde é possível, e a localização onde é obrigatório.
O que é necessário em qualquer abordagem: medidas organizacionais e técnicas
Ao ajudar empresas a implementar IA, observamos um erro comum: o foco exclusivo na pilha tecnológica. Implantam sua própria compilação e pensam que a tarefa está resolvida. Na prática, metade do sucesso é preparação organizacional, e sem ela, a tecnologia não funciona, por melhor que seja projetada.
- Política de Implementação de IA: Um documento formalizado que define quais classes de dados podem ser processadas por IA, quais não podem, o que constitui um incidente e como responder a um vazamento. Sem uma política, cada funcionário toma decisões individuais, levando a um uso de IA "sombra" incontrolável em seis meses.
- Papel do Chief AI Officer (CAIO): Em grandes empresas, surge uma posição dedicada à implementação de redes neurais e ao desenvolvimento da estratégia de IA. É importante notar que não se trata apenas de um profissional de TI. Grande parte do trabalho envolve gerenciamento de mudanças, treinamento, combate aos medos dos funcionários e construção de processos. A tecnologia aqui é uma ferramenta, não um fim em si mesma.
- Classificação de Dados e Treinamento: Antes de lançar a plataforma, cada classe de dados deve ser marcada: "pode ser enviada para modelos públicos", "só pode ser enviada para modelos locais", "não pode ser processada por IA de forma alguma". Todos os funcionários passam por treinamento no padrão corporativo de trabalho com IA – caso contrário, qualquer arquitetura vazará pelo elo mais fraco. Em nossa experiência, um curso de 4 a 6 horas por funcionário se paga no primeiro trimestre através da qualidade das solicitações e da redução de incidentes.
- Camada Técnica: Registro de todas as solicitações, acesso por papéis, integração DLP, criptografia de chats, agente de pré-moderação antes dos modelos, auditoria regular de uso. Sem registro, é impossível investigar incidentes. Sem RBAC, qualquer estagiário tem acesso ao modelo mais caro e consome tokens. Sem pré-moderação, um funcionário pode acidentalmente enviar dados pessoais para uma API externa – violando formalmente a LGPD (ou 152-FZ).
Checklist para Implementação Segura de IA:
- Política de implementação de IA aprovada com classes de dados e regulamentos de resposta.
- Responsável pela estratégia de IA designado (CAIO ou equivalente).
- Classificação de dados por níveis de sensibilidade realizada.
- Todos os funcionários passaram por treinamento obrigatório sobre o uso de IA.
- Registro ativado, RBAC, criptografia de chats.
- Sistema DLP integrado ao gateway corporativo de IA.
- Pré-moderação de solicitações funcionando antes do envio ao modelo.
- Auditoria regular de uso – pelo menos trimestralmente.
O que a arquitetura correta proporcionou: números de nossa implementação
Todas essas discussões sobre arquitetura só fazem sentido se, no final, houver um resultado mensurável. Compartilharei nosso próprio caso, pois só posso falar sobre outros em termos gerais sob NDA. O núcleo do negócio da Alpina Digital é a produção de livros. O ciclo – da compra de direitos à publicação – tradicionalmente levava cerca de 9 meses. Era um processo de investimento: dinheiro investido, o livro ainda não gerava receita, a rotatividade de capital era lenta. Quando o boom dos LLMs ocorreu em 2023, lançamos experimentos internos: onde, neste ciclo, a IA poderia acelerar o trabalho sem perda de qualidade – edição, revisão, anotações, tradução, materiais de marketing, design. Em dois anos, passamos pelo mesmo caminho que agora descrevemos para as empresas. Primeiro, o caos com assinaturas pessoais. Depois, o gateway corporativo com API. Em seguida, adicionamos um modelo local para manuscritos sensíveis sob NDA. A arquitetura final é um híbrido: AlpinaGPT como interface unificada, APIs externas para geração de ilustrações, textos de marketing e traduções, e um modelo local para trabalhar com textos de autores não publicados.
Resultado: o ciclo de produção de livros foi reduzido de 9 meses para 2 meses. Isso é uma aceleração de 4,5 vezes, mantendo a qualidade. A rotatividade de capital aumentou correspondentemente, pois cada livro começa a retornar o investimento significativamente mais cedo. Este não é um número de marketing – é um indicador operacional que vemos em nosso próprio P&L.
Economia: O uso de nossa própria plataforma em vez de assinaturas dispersas nos proporcionou uma economia de 8 vezes. Anteriormente, equipes individuais compravam assinaturas de US$ 120 para ChatGPT, Claude, Midjourney – o total para toda a empresa chegava a cerca de 800.000 rublos por mês. Através do gateway corporativo com chaves de API, a um custo de token, gastamos cerca de 100.000 rublos por mês. E, ao mesmo tempo, temos acesso a todos os modelos de ponta imediatamente, e não a um modelo escolhido por cada equipe.
Tempo de retorno do investimento: com a arquitetura correta, é de cerca de 6 meses para uma corporação típica de 100 funcionários. Isso sem contar a aceleração dos processos principais, apenas pela economia em assinaturas dispersas e a eliminação do uso "sombra".
Recomendações Finais:
- Comece não pela escolha do modelo, mas pela classificação de dados e política de segurança.
- Não contraponha API e on-premise – construa um híbrido para cenários reais.
- Gateway de API corporativo NÃO é o mesmo que ChatGPT pessoal; diferencie isso na comunicação com o CISO.
- Inclua o treinamento de funcionários no roteiro – sem ele, qualquer arquitetura vazará.
- Calcule o retorno do investimento não apenas pelas assinaturas, mas também pelos processos principais – aí reside o principal efeito.
Se você está na fase de "pilotos existem, mas a operação em escala não", o bloqueador mais comum não é a tecnologia, mas a solução arquitetônica de segurança. Se desejar discutir sua situação, entre em contato com a equipe AlpinaGPT; analisaremos gratuitamente: qual arquitetura se adequa aos seus dados, como passar pela auditoria do departamento de segurança, quais modelos e em qual camada manter, e por onde começar. Você também pode experimentar a plataforma com suas próprias tarefas.
E se quiser se aprofundar na implementação de IA, assine o canal do Telegram "Дело в промпте" (O Negócio no Prompt). Compartilhamos lá o que não cabe em artigos: casos de uso, resultados de implementações, guias e prompts prontos.





