Segurança em Open Source na Era da IA: Desafios e Oportunidades
A inteligência artificial está revolucionando a busca por vulnerabilidades em software open source, levantando preocupações sobre segurança e licenciamento. Este artigo explora os riscos e as estratégias para adaptar o ecossistema open source a essa nova realidade.
MundiX News·09 de junho de 2026·10 min de leitura·👁 8 views
Sistemas de IA já são capazes de reescrever um projeto open source do zero em questão de minutos. Uma parte da comunidade de TI vê isso como um problema, principalmente devido à incerteza jurídica em torno do licenciamento de soluções "geradas" por IA. Paralelamente, outra discussão ganha força: a de que redes neurais facilitam demais a busca por vulnerabilidades em software, abrindo novas avenidas para atacantes. Na Beeline Cloud, decidimos analisar a gravidade dessas preocupações e o que os especialistas do setor pensam sobre o assunto.
A IA está se tornando uma ferramenta poderosa na busca por falhas de segurança. Em maio, especialistas em segurança da Google registraram o primeiro caso em que atacantes, supostamente, usaram um sistema de IA para encontrar uma vulnerabilidade zero-day e criar um exploit. Um script malicioso em Python contornava a autenticação de dois fatores em uma ferramenta popular de administração web. A estrutura e o estilo do código, com muitas linhas de comentário explicativo, sugeriram que ele foi gerado por um modelo de linguagem grande. Essa evolução era esperada, pois profissionais de segurança já utilizam IA para testes de penetração e detecção de ameaças. Modelos de ponta (State-of-the-Art - SotA) são tão eficazes na identificação de vulnerabilidades que a nova Mythos da Anthropic foi inicialmente restrita a um número limitado de organizações, por receio de que hackers a utilizassem para ataques em massa. Embora a Anthropic tenha disponibilizado a ferramenta ao público, parte de sua funcionalidade de busca por falhas permanece restrita.
O fato de as redes neurais simplificarem a descoberta de vulnerabilidades é inegável. No início de maio, a Mozilla encontrou um bug de vinte anos no componente XSLT do motor Firefox, que causava falhas na reconstrução de tabelas hash e vazamentos de memória. Um sistema de IA ajudou os engenheiros a identificar mais de quatrocentas falhas de segurança em componentes diversos, como WebAssembly e IndexedDB. Na mesma época, pesquisadores da Red Hat, usando um sistema de agentes, descobriram uma vulnerabilidade crítica em uma API criptográfica do kernel que permaneceu oculta por nove anos, permitindo que usuários locais elevassem seus privilégios para administradores. O futuro aponta para um cenário onde redes neurais auxiliarão na descoberta regular e facilitada de exploits como esses.
De acordo com a Lei de Linus, com testes suficientes, é possível encontrar um bug em praticamente qualquer sistema. Nesse sentido, não é surpreendente que agentes de IA estejam descobrindo vulnerabilidades com mais frequência, dada a escala de análise incomparável às verificações manuais. Essa realidade gera preocupação na comunidade open source. Como o código de projetos open source é publicamente acessível, torna-se mais fácil para os atacantes analisá-lo em busca de pontos fracos. Diante disso, a pergunta sobre a viabilidade de manter o código aberto em novas condições tecnológicas surge com frequência. Os desenvolvedores da ferramenta de planejamento Cal.com, por exemplo, decidiram migrar seu projeto anteriormente open source para uma licença comercial. O diretor da empresa, Bailey Pamfiloff, chegou a classificar a acessibilidade do código aberto como uma "vulnerabilidade potencial" e declarou que, em sua opinião, "o open source está morto".
Além disso, desenvolvedores de projetos open source estão cada vez mais atentos a outros problemas de segurança, como o aumento acentuado no número de bug reports gerados por redes neurais. Esses relatórios consomem tempo e recursos, embora nem todas as "vulnerabilidades" identificadas por IA representem uma ameaça real. Apesar das amplas capacidades e conquistas dos sistemas de IA na busca por bugs, os falsos positivos são significativamente mais comuns do que se poderia imaginar. Por exemplo, a já mencionada ferramenta Mythos detectou cinco problemas potenciais no cURL, mas quatro deles se mostraram falsos positivos, e uma vulnerabilidade foi classificada pela equipe do cURL como de baixo risco, com a ressalva de que "não há motivo para pânico".
O fluxo de bug reports sobrecarrega os desenvolvedores de projetos abertos com uma avalanche de mensagens, muitas das quais não trazem benefícios reais. Daniel Stenberg, autor do cURL, chamou a atenção para esse problema. Após várias detecções falsas (nas quais a equipe ainda assim gastou tempo), ele implementou uma nova regra: os autores dos relatórios devem divulgar se sistemas de IA foram utilizados na busca por vulnerabilidades. Se a resposta for positiva, haverá um "interrogatório" para determinar se um humano participou da elaboração do relatório ou se ele foi inteiramente gerado por uma rede neural. Brian Grinstead, engenheiro principal da Mozilla, confirma a situação: "Relatórios de bugs gerados por sistemas de IA têm uma reputação mista, então o ceticismo é justificado. Um grande número de falsos positivos gera uma carga adicional para as equipes de projetos de código aberto".
A situação é agravada pelo fato de que muitos desenvolvedores de software de código aberto já operam no limite de suas capacidades. Às vezes, um projeto open source popular é mantido por um pequeno grupo de maintainers que corrigem bugs e preparam atualizações em seu tempo livre, sem qualquer financiamento. No entanto, nem todas as equipes estão dispostas a fechar seu código. Algumas, pelo contrário, acreditam que o open source continua sendo o principal mecanismo de defesa coletiva e que a comunidade aberta, em última instância, se adaptará aos novos desafios mais rapidamente do que os ecossistemas fechados.
Um especialista de uma grande empresa israelense de segurança cibernética afirma que a indústria de TI está entrando em uma nova fase, onde é necessário integrar ferramentas de IA ao pipeline de desenvolvimento para a busca automática de vulnerabilidades durante o processo de escrita de código. A equipe da Strix, que desenvolve uma ferramenta de pentesting baseada em agentes de IA, também acredita na necessidade de implementar sistemas inteligentes que analisem o código automaticamente antes de enviá-lo ao repositório. Segundo eles, essa é a única maneira de combater atacantes que já utilizam IA para criar exploits de dia zero.
É importante notar que já estão surgindo projetos open source que auxiliam na construção desses processos. Um exemplo é o framework CAI, projetado para automatizar tarefas de segurança cibernética usando agentes autônomos. No entanto, para o desenvolvimento sustentável de tais soluções em um ambiente aberto, é necessário o apoio não apenas da comunidade, mas também de grandes players, incluindo os desenvolvedores de modelos inteligentes. Por isso, surgem iniciativas como o projeto Glasswing da Anthropic, cujo objetivo é proteger o software de código aberto da ameaça dos modelos SotA. Glasswing reúne líderes de mercado como NVIDIA, Apple e Google, propondo trabalhar proativamente para encontrar e corrigir vulnerabilidades em softwares críticos antes que os atacantes possam explorá-las.
A batalha entre cibersegurança e cibercrime sempre foi uma luta infinita de "escudo e espada": enquanto uns buscam exploits, outros os corrigem. Mas na era dos sistemas de IA, a corrida armamentista atinge um novo patamar, e uma "economia" própria está surgindo no cenário de segurança cibernética. Segundo alguns especialistas, para fortalecer o sistema, basta gastar mais tokens na detecção de vulnerabilidades do que os atacantes gastam para invadir. Em abril, o AI Safety Institute (AISI) publicou um relatório avaliando as capacidades de vários modelos, incluindo o Claude Mythos, em cenários de ataques simulados a redes corporativas, desde a fase de reconhecimento até o controle total. Para cada teste, foi alocado um "orçamento" de no máximo 100 milhões de tokens, e observou-se uma tendência clara: quanto mais tokens o modelo utilizava, melhores eram seus resultados. Como observado pelo AISI, nenhum deles atingiu um platô. Se uma rede neural pode realizar ataques cada vez mais complexos enquanto o atacante tiver dinheiro, as questões de segurança cibernética se reduzem a uma fórmula simples: um sistema pode ser protegido se mais recursos forem gastos na busca por vulnerabilidades do que o atacante potencial está disposto a investir na busca e desenvolvimento de um exploit. Nesse contexto, o tamanho do orçamento de segurança da informação se torna um fator decisivo, o que pode levar ao aumento do custo de suporte para ecossistemas open source. Não é de surpreender que grandes empresas de TI já estejam aumentando seus investimentos em fundos especializados, preparando-se efetivamente para a próxima fase dessa corrida.
Apesar de todas as preocupações, é improvável que as redes neurais "enterrem" o open source. O software de código aberto continua a evoluir, tanto com os sistemas de IA quanto em torno deles. Por exemplo, o projeto OpenCode, que adquiriu popularidade colossal: um agente de IA que pode operar diretamente no terminal, acumulou mais de 165 mil estrelas no GitHub em menos de um ano. E o recente DeepSeek-V4-Pro, em benchmarks, é comparável aos melhores modelos ocidentais. No entanto, modelos abertos anteriores também foram muito procurados: um deles, após seu lançamento no início de 2025, alcançou o topo dos downloads nos EUA, superando o ChatGPT.
Mesmo agora, grandes projetos que desenvolvem ferramentas para o ecossistema de IA estão migrando intencionalmente para o open source para aproveitar a experiência da comunidade. Em abril deste ano, os autores do ambiente de desenvolvimento de agentes Warp mudaram a licença comercial do cliente para uma licença aberta. Eles explicaram sua decisão por razões práticas e pela aposta no desenvolvimento com o uso de sistemas de IA. A empresa acredita que essa é a única maneira de "lançar uma versão de maior qualidade do Warp" – em um ambiente aberto e em colaboração com a comunidade.
Além disso, o código aberto está se tornando a principal forma de participação de muitas empresas na corrida da IA. Assim, a Eclipse Foundation espera uma mudança em direção ao desenvolvimento de ferramentas de IA open source que ajudarão a integrar os fluxos de trabalho de agentes em sistemas existentes. A organização também prevê um novo ciclo de investimentos em software de código aberto. Várias figuras proeminentes na indústria de TI depositam grandes esperanças em modelos de IA open source. Por exemplo, o presidente da Mozilla, Mark Surman, acredita que, com a abordagem correta, eles podem "dominar o mundo" no bom sentido, tornando-se o paradigma principal. O importante é que esses modelos sejam verdadeiramente abertos: juntamente com os dados de treinamento, pesos e vieses. Somente então poderemos falar sobre o desenvolvimento coletivo de infraestrutura e padrões. Em outras palavras, enquanto alguns fecham seu código, temendo que a IA "cancele" o open source, outros depositam esperanças no desenvolvimento de toda a indústria de TI através de... IA open source.
A Beeline Cloud é um provedor de nuvem seguro. Desenvolvemos soluções em nuvem para que você ofereça os melhores serviços aos seus clientes.
O que mais ler em nosso blog no Habr e em nossa plataforma "vAYTI":
Dezenas de "navios de Teseu" já estão prontos, milhares mais a caminho! Nova disputa sobre o uso de IA em open source
Open source + IA = China: como modelos de linguagem abertos ajudaram o país a entrar na corrida
Por que o open source ainda não é totalmente seguro
Open source na Rússia. Por que a IA nos força a pensar sobre licenciamento
Problemas do mercado de open source na Rússia. Onde encontrar soluções
Sistemas de IA já são capazes de reescrever um projeto open source do zero em questão de minutos. Uma parte da comunidade de TI vê isso como um problema, principalmente devido à incerteza jurídica em torno do licenciamento de soluções "geradas" por IA. Paralelamente, outra discussão ganha força: a de que redes neurais facilitam demais a busca por vulnerabilidades em software, abrindo novas avenidas para atacantes. Na Beeline Cloud, decidimos analisar a gravidade dessas preocupações e o que os especialistas do setor pensam sobre o assunto.
A IA está se tornando uma ferramenta poderosa na busca por falhas de segurança. Em maio, especialistas em segurança da Google registraram o primeiro caso em que atacantes, supostamente, usaram um sistema de IA para encontrar uma vulnerabilidade zero-day e criar um exploit. Um script malicioso em Python contornava a autenticação de dois fatores em uma ferramenta popular de administração web. A estrutura e o estilo do código, com muitas linhas de comentário explicativo, sugeriram que ele foi gerado por um modelo de linguagem grande. Essa evolução era esperada, pois profissionais de segurança já utilizam IA para testes de penetração e detecção de ameaças. Modelos de ponta (State-of-the-Art - SotA) são tão eficazes na identificação de vulnerabilidades que a nova Mythos da Anthropic foi inicialmente restrita a um número limitado de organizações, por receio de que hackers a utilizassem para ataques em massa. Embora a Anthropic tenha disponibilizado a ferramenta ao público, parte de sua funcionalidade de busca por falhas permanece restrita.
O fato de as redes neurais simplificarem a descoberta de vulnerabilidades é inegável. No início de maio, a Mozilla encontrou um bug de vinte anos no componente XSLT do motor Firefox, que causava falhas na reconstrução de tabelas hash e vazamentos de memória. Um sistema de IA ajudou os engenheiros a identificar mais de quatrocentas falhas de segurança em componentes diversos, como WebAssembly e IndexedDB. Na mesma época, pesquisadores da Red Hat, usando um sistema de agentes, descobriram uma vulnerabilidade crítica em uma API criptográfica do kernel que permaneceu oculta por nove anos, permitindo que usuários locais elevassem seus privilégios para administradores. O futuro aponta para um cenário onde redes neurais auxiliarão na descoberta regular e facilitada de exploits como esses.
De acordo com a Lei de Linus, com testes suficientes, é possível encontrar um bug em praticamente qualquer sistema. Nesse sentido, não é surpreendente que agentes de IA estejam descobrindo vulnerabilidades com mais frequência, dada a escala de análise incomparável às verificações manuais. Essa realidade gera preocupação na comunidade open source. Como o código de projetos open source é publicamente acessível, torna-se mais fácil para os atacantes analisá-lo em busca de pontos fracos. Diante disso, a pergunta sobre a viabilidade de manter o código aberto em novas condições tecnológicas surge com frequência. Os desenvolvedores da ferramenta de planejamento Cal.com, por exemplo, decidiram migrar seu projeto anteriormente open source para uma licença comercial. O diretor da empresa, Bailey Pamfiloff, chegou a classificar a acessibilidade do código aberto como uma "vulnerabilidade potencial" e declarou que, em sua opinião, "o open source está morto".
Além disso, desenvolvedores de projetos open source estão cada vez mais atentos a outros problemas de segurança, como o aumento acentuado no número de bug reports gerados por redes neurais. Esses relatórios consomem tempo e recursos, embora nem todas as "vulnerabilidades" identificadas por IA representem uma ameaça real. Apesar das amplas capacidades e conquistas dos sistemas de IA na busca por bugs, os falsos positivos são significativamente mais comuns do que se poderia imaginar. Por exemplo, a já mencionada ferramenta Mythos detectou cinco problemas potenciais no cURL, mas quatro deles se mostraram falsos positivos, e uma vulnerabilidade foi classificada pela equipe do cURL como de baixo risco, com a ressalva de que "não há motivo para pânico".
O fluxo de bug reports sobrecarrega os desenvolvedores de projetos abertos com uma avalanche de mensagens, muitas das quais não trazem benefícios reais. Daniel Stenberg, autor do cURL, chamou a atenção para esse problema. Após várias detecções falsas (nas quais a equipe ainda assim gastou tempo), ele implementou uma nova regra: os autores dos relatórios devem divulgar se sistemas de IA foram utilizados na busca por vulnerabilidades. Se a resposta for positiva, haverá um "interrogatório" para determinar se um humano participou da elaboração do relatório ou se ele foi inteiramente gerado por uma rede neural. Brian Grinstead, engenheiro principal da Mozilla, confirma a situação: "Relatórios de bugs gerados por sistemas de IA têm uma reputação mista, então o ceticismo é justificado. Um grande número de falsos positivos gera uma carga adicional para as equipes de projetos de código aberto".
A situação é agravada pelo fato de que muitos desenvolvedores de software de código aberto já operam no limite de suas capacidades. Às vezes, um projeto open source popular é mantido por um pequeno grupo de maintainers que corrigem bugs e preparam atualizações em seu tempo livre, sem qualquer financiamento. No entanto, nem todas as equipes estão dispostas a fechar seu código. Algumas, pelo contrário, acreditam que o open source continua sendo o principal mecanismo de defesa coletiva e que a comunidade aberta, em última instância, se adaptará aos novos desafios mais rapidamente do que os ecossistemas fechados.
Um especialista de uma grande empresa israelense de segurança cibernética afirma que a indústria de TI está entrando em uma nova fase, onde é necessário integrar ferramentas de IA ao pipeline de desenvolvimento para a busca automática de vulnerabilidades durante o processo de escrita de código. A equipe da Strix, que desenvolve uma ferramenta de pentesting baseada em agentes de IA, também acredita na necessidade de implementar sistemas inteligentes que analisem o código automaticamente antes de enviá-lo ao repositório. Segundo eles, essa é a única maneira de combater atacantes que já utilizam IA para criar exploits de dia zero.
É importante notar que já estão surgindo projetos open source que auxiliam na construção desses processos. Um exemplo é o framework CAI, projetado para automatizar tarefas de segurança cibernética usando agentes autônomos. No entanto, para o desenvolvimento sustentável de tais soluções em um ambiente aberto, é necessário o apoio não apenas da comunidade, mas também de grandes players, incluindo os desenvolvedores de modelos inteligentes. Por isso, surgem iniciativas como o projeto Glasswing da Anthropic, cujo objetivo é proteger o software de código aberto da ameaça dos modelos SotA. Glasswing reúne líderes de mercado como NVIDIA, Apple e Google, propondo trabalhar proativamente para encontrar e corrigir vulnerabilidades em softwares críticos antes que os atacantes possam explorá-las.
A batalha entre cibersegurança e cibercrime sempre foi uma luta infinita de "escudo e espada": enquanto uns buscam exploits, outros os corrigem. Mas na era dos sistemas de IA, a corrida armamentista atinge um novo patamar, e uma "economia" própria está surgindo no cenário de segurança cibernética. Segundo alguns especialistas, para fortalecer o sistema, basta gastar mais tokens na detecção de vulnerabilidades do que os atacantes gastam para invadir. Em abril, o AI Safety Institute (AISI) publicou um relatório avaliando as capacidades de vários modelos, incluindo o Claude Mythos, em cenários de ataques simulados a redes corporativas, desde a fase de reconhecimento até o controle total. Para cada teste, foi alocado um "orçamento" de no máximo 100 milhões de tokens, e observou-se uma tendência clara: quanto mais tokens o modelo utilizava, melhores eram seus resultados. Como observado pelo AISI, nenhum deles atingiu um platô. Se uma rede neural pode realizar ataques cada vez mais complexos enquanto o atacante tiver dinheiro, as questões de segurança cibernética se reduzem a uma fórmula simples: um sistema pode ser protegido se mais recursos forem gastos na busca por vulnerabilidades do que o atacante potencial está disposto a investir na busca e desenvolvimento de um exploit. Nesse contexto, o tamanho do orçamento de segurança da informação se torna um fator decisivo, o que pode levar ao aumento do custo de suporte para ecossistemas open source. Não é de surpreender que grandes empresas de TI já estejam aumentando seus investimentos em fundos especializados, preparando-se efetivamente para a próxima fase dessa corrida.
Apesar de todas as preocupações, é improvável que as redes neurais "enterrem" o open source. O software de código aberto continua a evoluir, tanto com os sistemas de IA quanto em torno deles. Por exemplo, o projeto OpenCode, que adquiriu popularidade colossal: um agente de IA que pode operar diretamente no terminal, acumulou mais de 165 mil estrelas no GitHub em menos de um ano. E o recente DeepSeek-V4-Pro, em benchmarks, é comparável aos melhores modelos ocidentais. No entanto, modelos abertos anteriores também foram muito procurados: um deles, após seu lançamento no início de 2025, alcançou o topo dos downloads nos EUA, superando o ChatGPT.
Mesmo agora, grandes projetos que desenvolvem ferramentas para o ecossistema de IA estão migrando intencionalmente para o open source para aproveitar a experiência da comunidade. Em abril deste ano, os autores do ambiente de desenvolvimento de agentes Warp mudaram a licença comercial do cliente para uma licença aberta. Eles explicaram sua decisão por razões práticas e pela aposta no desenvolvimento com o uso de sistemas de IA. A empresa acredita que essa é a única maneira de "lançar uma versão de maior qualidade do Warp" – em um ambiente aberto e em colaboração com a comunidade.
Além disso, o código aberto está se tornando a principal forma de participação de muitas empresas na corrida da IA. Assim, a Eclipse Foundation espera uma mudança em direção ao desenvolvimento de ferramentas de IA open source que ajudarão a integrar os fluxos de trabalho de agentes em sistemas existentes. A organização também prevê um novo ciclo de investimentos em software de código aberto. Várias figuras proeminentes na indústria de TI depositam grandes esperanças em modelos de IA open source. Por exemplo, o presidente da Mozilla, Mark Surman, acredita que, com a abordagem correta, eles podem "dominar o mundo" no bom sentido, tornando-se o paradigma principal. O importante é que esses modelos sejam verdadeiramente abertos: juntamente com os dados de treinamento, pesos e vieses. Somente então poderemos falar sobre o desenvolvimento coletivo de infraestrutura e padrões. Em outras palavras, enquanto alguns fecham seu código, temendo que a IA "cancele" o open source, outros depositam esperanças no desenvolvimento de toda a indústria de TI através de... IA open source.
A Beeline Cloud é um provedor de nuvem seguro. Desenvolvemos soluções em nuvem para que você ofereça os melhores serviços aos seus clientes.
O que mais ler em nosso blog no Habr e em nossa plataforma "vAYTI":
Dezenas de "navios de Teseu" já estão prontos, milhares mais a caminho! Nova disputa sobre o uso de IA em open source
Open source + IA = China: como modelos de linguagem abertos ajudaram o país a entrar na corrida
Por que o open source ainda não é totalmente seguro
Open source na Rússia. Por que a IA nos força a pensar sobre licenciamento
Problemas do mercado de open source na Rússia. Onde encontrar soluções