coleta de dados parsing direitos autorais segurança de dados legislação

Coleta de Dados de Fontes Abertas: Por que é Arriscado Extrair Informações de Bancos de Dados Alheios?

A coleta de dados de fontes abertas, como sites e redes sociais, pode levar a litígios se envolver a extração de informações de bancos de dados protegidos. O artigo explora os limites legais da coleta de dados, incluindo o caso da rede social VKontakte e o embate entre LinkedIn e hiQ Labs, destacando a importância de respeitar os direitos autorais e as políticas de uso.

MundiX News·14 de maio de 2026·7 min de leitura·👁 9 views

Coletar informações sobre uma pessoa ou produto usando alta tecnologia tornou-se uma questão de técnica. No sentido literal e figurado da palavra. No entanto, essa extração de dados pode se tornar motivo de processo judicial. O porquê disso será abordado neste artigo.

Um Site como um Banco de Dados

Frequentemente, as informações sistematizadas em um site (catálogo, rede social, marketplace) são um banco de dados criado oficialmente. Os direitos sobre ele podem pertencer à empresa que desenvolveu esse site. Consequentemente, usar esses materiais em uma base comercial sem a permissão do detentor dos direitos autorais é reconhecido como uma violação.

Em 2017, nos tribunais russos, começou a audiência do caso da LLC "V Kontakte" contra a LLC "Double Data". A "Double Data" lançou vários programas:

Um mecanismo de busca (permite encontrar a conta de uma pessoa e fornecer um link para ela);
Software para visualização de informações por links;
Software que permite detectar "duplicatas" de contas de usuários.

A LLC "V Kontakte" considerou que o software especificado:

Funciona sem a devida permissão;
Destina-se à pontuação;
Viola seus direitos sobre o banco de dados formado.

Seguiu-se um recurso ao tribunal. O caso foi analisado por vários anos, passando sequencialmente por várias instâncias. Em última análise, o Tribunal de Direitos de Propriedade Intelectual aprovou um acordo de conciliação entre as corporações.

Juristas-analistas, analisando as decisões do SUI (embora não houvesse uma posição final sobre as principais questões), apontam para os seguintes detalhes importantes:

Mesmo que as informações tenham sido "despejadas" no banco de dados do site pelos próprios usuários, isso não significa que o criador (organizador) não tenha direitos sobre esse banco de dados.
A pessoa que investiu recursos significativos na criação do produto é considerada a fabricante do banco de dados.

Como Encontrar a Linha entre "Pode Processar" e "Não Pode"?

Em primeiro lugar, a liberdade de acesso à informação está consagrada na Constituição. Fatos individuais (preço de um produto, suas características, materiais de domínio público, etc.) não pertencem à categoria de objetos de direitos autorais.

Em segundo lugar, o fabricante do banco de dados recebe o direito exclusivo sobre ele se custos financeiros, organizacionais ou outros foram investidos na criação do produto.

Em terceiro lugar, um sujeito não pode usar uma parte substancial do banco de dados de outra pessoa em uma base sistemática sem a permissão do detentor dos direitos autorais. Isso significa, por exemplo, que elementos individuais ou uma parte insignificante do produto podem ser extraídos.

A linha entre substancialidade e insignificância neste caso é muito tênue. Pode passar, por exemplo, pelo volume de extração: se você usar dados insignificantes de no máximo um ou dois perfis em uma rede social, isso pode ser considerado legal; se você extrair dados de milhares de perfis em uma base comercial e, em seguida, analisá-los e fornecê-los a terceiros, isso pode ser reconhecido como ilegal.

Em quarto lugar, a estrutura do banco de dados criado está sob proteção legal.

Regras Básicas para Extração de Informações em Modo Automatizado (Parsing)

Não deve ser feito parsing:

Relacionado a dados pessoais (se a permissão não estiver explicitamente especificada na lei);
Conteúdo exclusivo postado.

Ao fazer parsing:

Acompanhe o que o proprietário do site especifica no arquivo robots.txt (ele determina quais seções do site são permitidas para indexação por mecanismos de busca e quais não são);
Não envie solicitações frequentes ao sistema (elas podem ser consideradas um ataque).

E não houve casos relacionados a parsing no Ocidente?

Houve.

Um dos casos significativos (e interessantes) é o confronto da rede social LinkedIn contra a hiQ Labs.

Representantes do LinkedIn afirmaram que seus oponentes (concorrentes) coletam dados de usuários disponíveis. Para evitar isso, a rede social bloqueou as páginas abertas.

No tribunal, a situação se desenvolveu da seguinte forma:

Na primeira instância, o LinkedIn foi proibido de restringir o acesso da hiQ Labs aos dados;
Em apelação, tal decisão foi confirmada (já que os próprios usuários abriram suas páginas, não se deve restringi-los em tal expressão de vontade).

O caso chegou ao Supremo Tribunal, que enviou o caso para revisão. Ao justificar sua decisão, o Supremo Tribunal citou o caso do policial Robert Van Buren, que, usando sua posição oficial, entrou no banco de dados da polícia e, por suborno, forneceu informações a outra pessoa sobre a placa de um motorista. O tribunal considerou que, neste caso, houve acesso não autorizado ilegal a um computador protegido. Ou seja: o policial tinha autoridade para obter informações, mas as usou para um propósito ilegal.

A apelação, levando em consideração tal decisão, considerou que a concepção de acesso não autorizado não pode ser aplicada a sites postados em domínio público. O acesso a dados abertos não foi restringido, nenhuma violação da Lei relevante foi vista.

Mas as empresas que possuem sites semelhantes não foram deixadas sem proteção: no acordo do usuário, você pode fornecer restrições, por não conformidade com as quais uma ação judicial seguirá.

🛡️⚡

Pare de pesquisar. Comece a hackear.

O MundiX é seu copiloto de pentest com IA: comandos exatos, análise de outputs e próximo passo na kill chain — em segundos.

Testar grátis por 7 dias →

Sem cartão para começar · Planos a partir de R$49/mês

Um Site como um Banco de Dados

Em 2017, nos tribunais russos, começou a audiência do caso da LLC "V Kontakte" contra a LLC "Double Data". A "Double Data" lançou vários programas:

Um mecanismo de busca (permite encontrar a conta de uma pessoa e fornecer um link para ela);
Software para visualização de informações por links;
Software que permite detectar "duplicatas" de contas de usuários.

A LLC "V Kontakte" considerou que o software especificado:

Funciona sem a devida permissão;
Destina-se à pontuação;
Viola seus direitos sobre o banco de dados formado.

Juristas-analistas, analisando as decisões do SUI (embora não houvesse uma posição final sobre as principais questões), apontam para os seguintes detalhes importantes:

Mesmo que as informações tenham sido "despejadas" no banco de dados do site pelos próprios usuários, isso não significa que o criador (organizador) não tenha direitos sobre esse banco de dados.
A pessoa que investiu recursos significativos na criação do produto é considerada a fabricante do banco de dados.

Como Encontrar a Linha entre "Pode Processar" e "Não Pode"?

Em segundo lugar, o fabricante do banco de dados recebe o direito exclusivo sobre ele se custos financeiros, organizacionais ou outros foram investidos na criação do produto.

Em quarto lugar, a estrutura do banco de dados criado está sob proteção legal.

Regras Básicas para Extração de Informações em Modo Automatizado (Parsing)

Não deve ser feito parsing:

Relacionado a dados pessoais (se a permissão não estiver explicitamente especificada na lei);
Conteúdo exclusivo postado.

Ao fazer parsing:

Acompanhe o que o proprietário do site especifica no arquivo robots.txt (ele determina quais seções do site são permitidas para indexação por mecanismos de busca e quais não são);
Não envie solicitações frequentes ao sistema (elas podem ser consideradas um ataque).

E não houve casos relacionados a parsing no Ocidente?

Houve.

Um dos casos significativos (e interessantes) é o confronto da rede social LinkedIn contra a hiQ Labs.

Representantes do LinkedIn afirmaram que seus oponentes (concorrentes) coletam dados de usuários disponíveis. Para evitar isso, a rede social bloqueou as páginas abertas.

No tribunal, a situação se desenvolveu da seguinte forma:

Na primeira instância, o LinkedIn foi proibido de restringir o acesso da hiQ Labs aos dados;
Em apelação, tal decisão foi confirmada (já que os próprios usuários abriram suas páginas, não se deve restringi-los em tal expressão de vontade).

📤 Compartilhar & Baixar

🧰 Ferramentas recomendadas

Divulgação: alguns links são patrocinados. Podemos receber comissão se você comprar — sem custo extra para você. Só indicamos o que faz sentido para a comunidade.

Aprendendo Kali Linux: Teste de segurança, pentest e hacking ético

Com centenas de ferramentas pré-instaladas, a distribuição Kali Linux facilita o trabalho de os profissionais de segurança começarem a fazer testes de segurança rapidamente. No entanto, com mais de 600 ferramentas em seu arsenal, o Kali Linux também pode ser desafiador. A nova edição deste prático livro abrange as atualizações nas ferramentas e inclui uma melhor abordagem da análise forense e da engenharia reversa. Ric Messier, autor, não fica apenas no teste de segurança, mas também faz uma abordagem sobre a execução de análise forense, incluindo a análise em disco e na memória, assim como alguma análise básica de malware. • Explore as diversas ferramentas disponíveis no Kali Linux • Entenda o valor do teste de segurança e examine os tipos de teste disponíveis • Aprenda os aspectos básicos do pentest em todo o ciclo de vida do ataque • Instale o Kali Linux em vários sistemas, tanto físicos quanto virtuais • Descubra como usar diferentes ferramentas destinadas à segurança • Estruture um teste de segurança baseado nas ferramentas do Kali Linux • Estenda as ferramentas do Kali para criar técnicas de ataque avançadas • Use o Kali Linux para ajudar a criar relatórios quando o teste terminar “A abordagem concisa, clara e baseada na experiência adotada por Ric Messier para a introdução do Kali Linux e dos testes de cibersegurança é incomparável. Este livro é uma leitura excelente e acessível para iniciantes e um recurso valioso para qualquer pessoa.” —Alexander Arlt, Consultor sênior de segurança, Google

Ver na Amazon →

Gshield 2 em 1 Hub Extensor Conector USB-C + USB-A e Adaptador de Rede Ethernet LAN RJ45 com 3 Entradas USB 3.0 até 5 Gbps em Liga de Alumínio para Computador e Notebook, Cinza

Compatível com portas USB-C e USB-A, ideal para ampliar a conectividade de dispositivos como MacBook Pro e outros com portas USB-C. Inclui um adaptador USB-A extra, proporcionando uma conexão Ethernet estável e veloz de até 1 Gbps, perfeita para filmes, jogos online e videoconferências. Oferece três portas USB 3.0 com velocidades de transferência de até 5 Gbps, permitindo conectar mouse, teclado, discos rígidos e outros periféricos. Fabricado em alumínio durável, garantindo longa vida útil e resistência ao uso diário. Design compacto e leve, ideal para viagens de negócios e uso diário, facilitando o transporte e armazenamento. Funciona com Windows 10/8.1/8, Mac OS e Chrome OS, oferecendo versatilidade incomparável para diversas necessidades de conectividade. Assegura uma conectividade estável e rápida, perfeita para tarefas exigentes como transferência de dados, streaming e mais.

Ver na Amazon →

Hacking APIs: Breaking Web Application Programming Interfaces

Hacking APIs is a crash course on web API security testing that will prepare you to penetration-test APIs, reap high rewards on bug bounty programs, and make your own APIs more secure. You'll learn how REST and GraphQL APIs work in the wild and set up a streamlined API testing lab with Burp Suite and Postman. Then you'll master tools useful for reconnaissance, endpoint analysis, and fuzzing, such as Kiterunner and OWASP Amass. Next, you'll learn to perform common attacks, like those targeting an API's authentication mechanisms and the injection vulnerabilities commonly found in web applications. You'll also learn techniques for bypassing protections against these attacks. In the book's nine guided labs, which target intentionally vulnerable APIs, you'll practice: Enumerating APIs users and endpoints using fuzzing techniques Using Postman to discover an excessive data exposure vulnerability Performing a JSON Web Token attack against an API authentication process Combining multiple API attack techniques to perform a NoSQL injection Attacking a GraphQL API to uncover a broken object level authorization vulnerability

Ver oferta →

Gray Hat Hacking: The Ethical Hacker's Handbook, Sixth Edition

Up-to-date strategies for thwarting the latest, most insidious network attacks This fully updated, industry-standard security resource shows, step by step, how to fortify computer networks by learning and applying effective ethical hacking techniques. Based on curricula developed by the authors at major security conferences and colleges, the book features actionable planning and analysis methods as well as practical steps for identifying and combating both targeted and opportunistic attacks. Gray Hat Hacking: The Ethical Hacker's Handbook, Sixth Edition clearly explains the enemy's devious weapons, skills, and tactics and offers field-tested remedies, case studies, and testing labs. You will get complete coverage of Internet of Things, mobile, and Cloud security along with penetration testing, malware analysis, and reverse engineering techniques. State-of-the-art malware, ransomware, and system exploits are thoroughly explained. Fully revised content includes 7 new chapters covering the latest threats Includes proof-of-concept code stored on the GitHub repository Authors train attendees at major security conferences, including RSA, Black Hat, Defcon, and B-Sides

Ver na Amazon →

Bloqueador USB de privacidade de porta USB para PC, notebook, bloco de laptop,

Proteção de privacidade aprimorada: protege o link de transmissão de dados para evitar roubo de informações, fornecendo proteção de segurança robusta que protege a privacidade do usuário durante transferências de arquivos e garante uma conexão segura para interações de dispositivos sem preocupações em vários ambientes Uso a longo prazo: a camada protetora resistente ao desgaste, combinada com um corpo de metal resistente, oferece gerenciamento de calor confiável e qualidade duradoura durante o uso diário Entrega eficiente de energia: a tecnologia de chip inteligente garante a identificação automática dos requisitos de energia, fornecendo carregamento eficiente alinhando-se com vários protocolos de carregamento rápido para maior conveniência Proteção contra sobrecarga: evitando riscos de sobrecarga, este bloqueador de dados USB protege a vida útil da bateria e garante um desempenho estável, mantendo um fluxo estável de energia para melhorar a longevidade do dispositivo de forma eficaz Prático de transportar: com atenção à portabilidade, este bloqueador de dados USB oferece um design compacto que é leve e fácil de transportar, melhorando a conveniência do usuário e operação eficiente

Ver na Amazon →

📩 Newsletter MundiX

Receba novidades de cibersegurança + um checklist de pentest grátis. Sem spam.

Ao assinar você concorda em receber e-mails. Cancele quando quiser.

Aprendendo Kali Linux: Teste de segurança, pentest e hacking ético

Hacking APIs: Breaking Web Application Programming Interfaces

Bloqueador USB de privacidade de porta USB para PC, notebook, bloco de laptop,

Coleta de Dados de Fontes Abertas: Por que é Arriscado Extrair Informações de Bancos de Dados Alheios?

Um Site como um Banco de Dados

Como Encontrar a Linha entre "Pode Processar" e "Não Pode"?

Regras Básicas para Extração de Informações em Modo Automatizado (Parsing)

E não houve casos relacionados a parsing no Ocidente?

Pare de pesquisar. Comece a hackear.

Um Site como um Banco de Dados

Como Encontrar a Linha entre "Pode Processar" e "Não Pode"?

Regras Básicas para Extração de Informações em Modo Automatizado (Parsing)

E não houve casos relacionados a parsing no Ocidente?

📤 Compartilhar & Baixar

🧰 Ferramentas recomendadas

Aprendendo Kali Linux: Teste de segurança, pentest e hacking ético

Gshield 2 em 1 Hub Extensor Conector USB-C + USB-A e Adaptador de Rede Ethernet LAN RJ45 com 3 Entradas USB 3.0 até 5 Gbps em Liga de Alumínio para Computador e Notebook, Cinza

Hacking APIs: Breaking Web Application Programming Interfaces

Gray Hat Hacking: The Ethical Hacker's Handbook, Sixth Edition

Bloqueador USB de privacidade de porta USB para PC, notebook, bloco de laptop,

📩 Newsletter MundiX

Artigos Relacionados

A Voz da Sua Mãe ao Telefone Pode Ser um Deepfake: Ministério da Justiça Propõe Punição Mais Severa

Gshield 2 em 1 Hub Extensor Conector USB-C + USB-A e Adaptador de Rede Ethernet LAN RJ45 com 3 Entradas USB 3.0 até 5 Gbps em Liga de Alumínio para Computador e Notebook, Cinza

Gray Hat Hacking: The Ethical Hacker's Handbook, Sixth Edition