Pesquisa Profunda Local: Aprimorando seu Próprio Motor de Busca com IA
Explore como ir além de buscas lineares e construir um sistema de pesquisa autônomo e profundo utilizando agentes LangGraph. Descubra os benefícios e desafios de rodar seu próprio motor de busca com IA localmente.
MundiX News·05 de junho de 2026·7 min de leitura·👁 15 views
Existem diversas razões para implementar agentes de IA em seu próprio hardware em vez de pagar por um provedor. Hoje, veremos como transitar de sistemas com pipelines lineares para pesquisa autônoma profunda baseada em agentes LangGraph. Na última matéria sobre Deep Research, já começamos a explorar motores de busca caseiros e projetos de pesquisa com o exemplo do Vane. Hoje, tentaremos algo mais poderoso.
O que é Deep Research e para que serve? Tais sistemas, e já existem muitos, funcionam como um analista pessoal: não apenas respondem a uma pergunta, mas a analisam de todos os ângulos, constroem um plano de pesquisa, acessam motores de busca, trabalham com fontes, filtram ruído informacional e compilam um relatório detalhado. Essencialmente, acabei de descrever o algoritmo de funcionamento desses sistemas, mas com uma ressalva: em sistemas com pipeline, a pesquisa ocorre linearmente ou, na melhor das hipóteses, iterativamente, enquanto em sistemas mais complexos surge a reflexão. A cada passo, o sistema se pergunta: esses dados se relacionam exatamente com a solicitação do usuário? São suficientes ou é necessário mais? Se a resposta a qualquer uma dessas perguntas for negativa, o sistema muda de estratégia: tenta outras fontes ou modifica a consulta de pesquisa.
Em geral, isso é um must-have para tarefas complexas, quando é necessário mergulhar em um tópico desconhecido do zero, e não há tempo ou desejo para peneirar manualmente centenas de abas. (Já para trabalhos escolares ou de curso, tal sistema, em primeiro lugar, é excessivo e, em segundo lugar, detectores de texto gerados por IA também existem).
Por que vale a pena implementar tal sistema especificamente em seu computador pessoal? Há muitas vantagens:
Liberdade de escolha: Você decide qual modelo usar como orquestrador. Se para alguma tarefa for necessário um modelo sem censura, basta baixar os pesos necessários.
Sem assinaturas ou banimentos: Sua conta nunca será bloqueada repentinamente devido a mudanças nas regras corporativas, uma pergunta incorreta ou suspeita de ser menor de idade.
Economia (embora, considerando o custo do hardware, seja bastante condicional): agentes autônomos leem e processam grandes volumes de texto. Ou você pega uma assinatura com um limite generoso, ou paga por tokens via API, gastando somas consideráveis por milhões de tokens consumidos. No entanto, nada impede que você conecte algum modelo barato via API (apenas que não seja o DeepSeek! Qualquer coisa, menos ele!).
Além disso, alguns sistemas locais – incluindo aquele que analisaremos hoje – tornam-se mais inteligentes com o tempo. Todos os materiais valiosos que o agente encontrar durante o trabalho poderão ser salvos em um banco de dados local criptografado SQLCipher. Em seguida, o sistema vetorizará os dados para RAG e, em resposta a futuras consultas, poderá se basear em seu arquivo de conhecimento pessoal e já verificado.
Claro, existem desvantagens, e o óbvio "elefante na sala" é o hardware. Você provavelmente está ciente da situação atual com os preços de qualquer hardware que possa ser adaptado para IA; nos próximos anos, certamente não melhorará. A velocidade e a qualidade do trabalho do agente dependem da potência da sua placa de vídeo e – o que é mais importante! – do volume de VRAM. Para modelos com arquitetura MoE, essa limitação pode ser contornada descarregando parte dos especialistas na memória RAM, mas, em igualdade de condições, MoE é inferior aos análogos densos.
Além disso, "pesquisa local" é um nome ligeiramente enganoso. Sim, o cérebro do sistema e o banco de dados funcionam em seu computador, mas para buscar materiais recentes, o agente precisa de acesso livre à internet para extrair o conhecimento necessário de lá.
De "busca inteligente" a pesquisa profunda
Na última matéria, descrevi detalhadamente o Vane – uma excelente substituição para motores de busca de IA com um modo adicional de Deep Research. Direi imediatamente: o Vane se tornou útil para mim, eu o uso regularmente. Já outros produtos da matéria – não: o GPT Researcher não serviu de imediato, o Deep Research da dzhng foi abandonado com o tempo – o mesmo modelo de pipeline, mas inconveniente de usar.
Por outro lado, como herança, fiquei com um container com SearXNG – um metapesquisador muito rápido que funciona localmente. Ele nos será útil para trabalhar com o Local Deep Research, mas, se você não leu a matéria anterior ou não instalou o SearXNG, não se preocupe: vamos instalá-lo separadamente.
Qual a diferença entre o Local Deep Research, projeto do desenvolvedor LearningCircuit, sobre o qual falamos hoje, e o Vane? O Vane é uma coisa maravilhosa que substitui a versão básica do Perplexity: você faz uma pergunta – recebe uma resposta e uma lista de links relevantes. Simples, barato e eficaz. O modo Deep Research embutido no Vane é mais interessante, mas não chega a ser um análogo completo do Deep Research do Perplexity Pro.
Mas o Local Deep Research do LearningCircuit é outra história. Se o Vane simplesmente consulta um motor de busca e alimenta os resultados em um modelo de linguagem, mesmo que em várias iterações, o Local Deep Research (LDR) implementa ferramentas de automação sérias. No LDR, você ainda usa seu modelo favorito, o familiar motor KoboldCpp, llama.cpp ou LM Studio e o motor de busca SearXNG; o próprio LDR é um analista inteligente aqui: ele orquestra agentes autônomos e é capaz de realizar análises complexas e multifacetadas.
Com essa abordagem, o projeto não parece mais uma substituição da versão gratuita do Perplexity – é um concorrente da assinatura paga Perplexity Pro com seu algoritmo de pesquisa profunda passo a passo. Observo separadamente: pelo menos nas minhas consultas – um concorrente bastante decente. Além disso, há controle total sobre seus bancos de dados: criptografia obrigatória (e não pense em perder a senha, você não conseguirá recuperá-la!).
Planejamento Estratégico
Vamos dar uma olhada sob o capô e entender como o Local Deep Research funciona. Nas versões iniciais do projeto (e na maioria dos análogos – por exemplo, no Vane já analisado) eram usados pipelines clássicos: algoritmos lineares do tipo "analisar consulta → gerar consultas de pesquisa → executar pesquisa → fazer resumo". Depois, a partir da versão 1.4, os desenvolvedores implementaram o ReAct Agent (estratégia MCP) – uma versão inicial do modo autônomo, onde o LLM decidia quais ferramentas usar, através de um ciclo de raciocínio Thought → Action → Observation.
A versão atual – a estratégia LangGraph Agent, que é usada por padrão. Em certo sentido, o agente LangGraph funciona como um analista vivo: a rede neural decide o que procurar, em quais bancos de dados especializados e quando os dados são suficientes para compilar a resposta final.
O motor é capaz de alternar entre fontes em tempo real. Por exemplo, se a busca através do SearXNG local fornecer links para artigos científicos, o agente reconhecerá o contexto e mudará automaticamente para o Semantic Scholar para extrair metadados e o grafo de citações. Se o tópico for sobre medicina, o agente se encarregará de buscar no PubMed. O sistema possui muitos conectores: de arXiv e Wikipedia à enorme base de dados aberta OpenAlex. Como resultado, o agente pode coletar fontes de qualidade muito maiores do que quaisquer estratégias de pipeline.
Por padrão, cinco estratégias estão disponíveis na interface:
Source-Based (melhor para janelas de contexto abaixo de 16.000 tokens)
Focused Iteration — Quick (saída mínima de texto)
Focused Iteration — Comprehensive (requer uma janela de contexto acima de 16.000 tokens)
Sem cartão para começar · Planos a partir de R$49/mês
Existem diversas razões para implementar agentes de IA em seu próprio hardware em vez de pagar por um provedor. Hoje, veremos como transitar de sistemas com pipelines lineares para pesquisa autônoma profunda baseada em agentes LangGraph. Na última matéria sobre Deep Research, já começamos a explorar motores de busca caseiros e projetos de pesquisa com o exemplo do Vane. Hoje, tentaremos algo mais poderoso.
O que é Deep Research e para que serve? Tais sistemas, e já existem muitos, funcionam como um analista pessoal: não apenas respondem a uma pergunta, mas a analisam de todos os ângulos, constroem um plano de pesquisa, acessam motores de busca, trabalham com fontes, filtram ruído informacional e compilam um relatório detalhado. Essencialmente, acabei de descrever o algoritmo de funcionamento desses sistemas, mas com uma ressalva: em sistemas com pipeline, a pesquisa ocorre linearmente ou, na melhor das hipóteses, iterativamente, enquanto em sistemas mais complexos surge a reflexão. A cada passo, o sistema se pergunta: esses dados se relacionam exatamente com a solicitação do usuário? São suficientes ou é necessário mais? Se a resposta a qualquer uma dessas perguntas for negativa, o sistema muda de estratégia: tenta outras fontes ou modifica a consulta de pesquisa.
Em geral, isso é um must-have para tarefas complexas, quando é necessário mergulhar em um tópico desconhecido do zero, e não há tempo ou desejo para peneirar manualmente centenas de abas. (Já para trabalhos escolares ou de curso, tal sistema, em primeiro lugar, é excessivo e, em segundo lugar, detectores de texto gerados por IA também existem).
Por que vale a pena implementar tal sistema especificamente em seu computador pessoal? Há muitas vantagens:
Liberdade de escolha: Você decide qual modelo usar como orquestrador. Se para alguma tarefa for necessário um modelo sem censura, basta baixar os pesos necessários.
Sem assinaturas ou banimentos: Sua conta nunca será bloqueada repentinamente devido a mudanças nas regras corporativas, uma pergunta incorreta ou suspeita de ser menor de idade.
Economia (embora, considerando o custo do hardware, seja bastante condicional): agentes autônomos leem e processam grandes volumes de texto. Ou você pega uma assinatura com um limite generoso, ou paga por tokens via API, gastando somas consideráveis por milhões de tokens consumidos. No entanto, nada impede que você conecte algum modelo barato via API (apenas que não seja o DeepSeek! Qualquer coisa, menos ele!).
Além disso, alguns sistemas locais – incluindo aquele que analisaremos hoje – tornam-se mais inteligentes com o tempo. Todos os materiais valiosos que o agente encontrar durante o trabalho poderão ser salvos em um banco de dados local criptografado SQLCipher. Em seguida, o sistema vetorizará os dados para RAG e, em resposta a futuras consultas, poderá se basear em seu arquivo de conhecimento pessoal e já verificado.
Claro, existem desvantagens, e o óbvio "elefante na sala" é o hardware. Você provavelmente está ciente da situação atual com os preços de qualquer hardware que possa ser adaptado para IA; nos próximos anos, certamente não melhorará. A velocidade e a qualidade do trabalho do agente dependem da potência da sua placa de vídeo e – o que é mais importante! – do volume de VRAM. Para modelos com arquitetura MoE, essa limitação pode ser contornada descarregando parte dos especialistas na memória RAM, mas, em igualdade de condições, MoE é inferior aos análogos densos.
Além disso, "pesquisa local" é um nome ligeiramente enganoso. Sim, o cérebro do sistema e o banco de dados funcionam em seu computador, mas para buscar materiais recentes, o agente precisa de acesso livre à internet para extrair o conhecimento necessário de lá.
De "busca inteligente" a pesquisa profunda
Na última matéria, descrevi detalhadamente o Vane – uma excelente substituição para motores de busca de IA com um modo adicional de Deep Research. Direi imediatamente: o Vane se tornou útil para mim, eu o uso regularmente. Já outros produtos da matéria – não: o GPT Researcher não serviu de imediato, o Deep Research da dzhng foi abandonado com o tempo – o mesmo modelo de pipeline, mas inconveniente de usar.
Por outro lado, como herança, fiquei com um container com SearXNG – um metapesquisador muito rápido que funciona localmente. Ele nos será útil para trabalhar com o Local Deep Research, mas, se você não leu a matéria anterior ou não instalou o SearXNG, não se preocupe: vamos instalá-lo separadamente.
Qual a diferença entre o Local Deep Research, projeto do desenvolvedor LearningCircuit, sobre o qual falamos hoje, e o Vane? O Vane é uma coisa maravilhosa que substitui a versão básica do Perplexity: você faz uma pergunta – recebe uma resposta e uma lista de links relevantes. Simples, barato e eficaz. O modo Deep Research embutido no Vane é mais interessante, mas não chega a ser um análogo completo do Deep Research do Perplexity Pro.
Mas o Local Deep Research do LearningCircuit é outra história. Se o Vane simplesmente consulta um motor de busca e alimenta os resultados em um modelo de linguagem, mesmo que em várias iterações, o Local Deep Research (LDR) implementa ferramentas de automação sérias. No LDR, você ainda usa seu modelo favorito, o familiar motor KoboldCpp, llama.cpp ou LM Studio e o motor de busca SearXNG; o próprio LDR é um analista inteligente aqui: ele orquestra agentes autônomos e é capaz de realizar análises complexas e multifacetadas.
Com essa abordagem, o projeto não parece mais uma substituição da versão gratuita do Perplexity – é um concorrente da assinatura paga Perplexity Pro com seu algoritmo de pesquisa profunda passo a passo. Observo separadamente: pelo menos nas minhas consultas – um concorrente bastante decente. Além disso, há controle total sobre seus bancos de dados: criptografia obrigatória (e não pense em perder a senha, você não conseguirá recuperá-la!).
Planejamento Estratégico
Vamos dar uma olhada sob o capô e entender como o Local Deep Research funciona. Nas versões iniciais do projeto (e na maioria dos análogos – por exemplo, no Vane já analisado) eram usados pipelines clássicos: algoritmos lineares do tipo "analisar consulta → gerar consultas de pesquisa → executar pesquisa → fazer resumo". Depois, a partir da versão 1.4, os desenvolvedores implementaram o ReAct Agent (estratégia MCP) – uma versão inicial do modo autônomo, onde o LLM decidia quais ferramentas usar, através de um ciclo de raciocínio Thought → Action → Observation.
A versão atual – a estratégia LangGraph Agent, que é usada por padrão. Em certo sentido, o agente LangGraph funciona como um analista vivo: a rede neural decide o que procurar, em quais bancos de dados especializados e quando os dados são suficientes para compilar a resposta final.
O motor é capaz de alternar entre fontes em tempo real. Por exemplo, se a busca através do SearXNG local fornecer links para artigos científicos, o agente reconhecerá o contexto e mudará automaticamente para o Semantic Scholar para extrair metadados e o grafo de citações. Se o tópico for sobre medicina, o agente se encarregará de buscar no PubMed. O sistema possui muitos conectores: de arXiv e Wikipedia à enorme base de dados aberta OpenAlex. Como resultado, o agente pode coletar fontes de qualidade muito maiores do que quaisquer estratégias de pipeline.
Por padrão, cinco estratégias estão disponíveis na interface:
Source-Based (melhor para janelas de contexto abaixo de 16.000 tokens)
Focused Iteration — Quick (saída mínima de texto)
Focused Iteration — Comprehensive (requer uma janela de contexto acima de 16.000 tokens)
Divulgação: alguns links são patrocinados. Podemos receber comissão se você comprar — sem custo extra para você. Só indicamos o que faz sentido para a comunidade.