Do Processo Manual à IA: Como o Centro Nacional de Pesquisa Cardiológica Russo Otimiza o Rastreamento de Riscos Cardiovasculares
O Centro Nacional de Pesquisa Cardiológica russo implementou um registro digital de pacientes com Síndrome Coronariana Aguda (SCA), utilizando IA para processar dados médicos. A solução automatiza a extração e anonimização de informações, transformando o rastreamento de riscos e a pesquisa médica.
MundiX News·02 de junho de 2026·14 min de leitura·👁 5 views
A Síndrome Coronariana Aguda (SCA) representa a forma mais perigosa de doença cardíaca isquêmica. Pacientes que sofrem de SCA integram um grupo de altíssimo risco para futuras complicações cardiovasculares, com uma taxa de mortalidade que pode atingir 20% em até quatro anos. Para combater essa realidade, o Centro Nacional de Pesquisa Cardiológica (NMITSK) E.I. Chazova, com o apoio do Centro de Tecnologias para a Sociedade da Yandex Cloud, lançou um registro digital de pacientes que vivenciaram SCA. Essa iniciativa envolveu o processamento seguro de mais de 13 mil documentos médicos através de modelos de linguagem de grande porte (LLMs), fornecendo aos cardiologistas informações cruciais para pesquisa, monitoramento e prevenção de riscos.
A necessidade dessa solução surgiu da colaboração entre a equipe do Centro de Tecnologias para a Sociedade, especialistas do NMITSK e a Oficina Yandex Praktikum. Os cardiologistas buscaram auxílio para desenvolver um modelo preditivo de riscos de SCA. Para viabilizar essa tarefa com IA, era fundamental compreender a estrutura de coleta e análise de dados, bem como a natureza dos próprios dados. Anteriormente, a maior parte das informações sobre pacientes com SCA estava armazenada em formato bruto e não estruturado em documentos médicos. Em particular, o prontuário de alta, um documento não estruturado de 3 a 6 páginas, continha uma vasta quantidade de dados essenciais para a previsão, incluindo histórico médico, dados de exame físico, resultados de exames instrumentais e laboratoriais, e informações sobre tratamento cirúrgico e farmacológico. Embora um médico possa analisar o impacto do tratamento no curso da doença de um paciente específico, a agregação dessas informações em nível regional resultava em um registro nosológico regional. Essa base de dados, essencialmente uma grande tabela com inúmeros campos detalhando hospitalizações e o curso da doença, era utilizada para análise de dados e controle de qualidade do atendimento médico, para facilitar a comunicação entre a atenção primária e especializada, e para coleta de estatísticas médicas e pesquisa sobre o tratamento da SCA. Por muito tempo, o trabalho com esse registro era manual, consumindo horas semanais de especialistas qualificados, o que motivou a busca por uma solução automatizada.
A digitalização desse processo prometia benefícios significativos tanto para os médicos assistentes quanto para os pesquisadores. A transferência automática de dados de documentos permitiria um acompanhamento mais eficaz de novos pacientes diagnosticados com SCA. Um sistema automatizado poderia gerar alertas, como a falta de acompanhamento ambulatorial ou a não adesão a medicamentos prescritos, indicando a necessidade de intervenção para evitar a piora do prognóstico. Assim, a tarefa foi reformulada para a criação de um registro digital com preenchimento automático de dados. A região de Tula foi escolhida como piloto para a primeira fase do projeto, devido à sua robusta rede de cardiologia e um volume considerável de dados sobre SCA – mais de 13 mil documentos de centros vasculares entre 2021 e 2025. Para a criação deste registro digital, três etapas foram cruciais: a anonimização dos dados, a extração de características dos documentos para identificar entidades nomeadas e a montagem do registro com acesso granular, separando dados pessoais para médicos e estatísticas agregadas para pesquisa. A anonimização, em particular, exigiu atenção especial em termos de segurança da informação, utilizando métodos como a substituição de identificadores e a modificação ou distorção de dados, conforme regulamentado pelo RKN (Serviço Federal de Supervisão de Comunicações, Tecnologias de Informação e Mídia de Massa da Rússia).
Na prática, a solução implementada utiliza LLMs como YandexGPT Lite e Alice AI LLM, disponíveis na plataforma Yandex AI Studio. O sistema funciona como um construtor, adaptável a diversos tipos de documentos médicos. O processo envolve a definição de um esquema para o documento, a conversão dos arquivos para Markdown (formato nativo para LLMs), e a execução do processamento em múltiplos fluxos. Para garantir a previsibilidade e a consistência das respostas da LLM, são utilizados structured outputs, assegurando que o modelo retorne os dados no formato JSON especificado. A extração de dados pessoais, a geração de Unique Identifiers (UIDs) e a aplicação das estratégias de anonimização são realizadas de forma automatizada, com os resultados salvos para posterior análise. Um desafio particular foi a dificuldade da LLM em reter a posição exata das entidades no texto, o que foi superado salvando trechos de texto (snippets) juntamente com as entidades extraídas. A estratégia de anonimização com deterministic noise, utilizando uma salt (um segredo), foi empregada tanto para distorcer dados quanto para gerar identificadores únicos (UIDs) de forma determinística, permitindo a correlação de documentos de um mesmo indivíduo. A qualidade da anonimização foi rigorosamente validada através de dados sintéticos, ajustes finos com especialistas regionais e a revisão manual de centenas e, posteriormente, milhares de documentos. O resultado é um registro digital que economiza horas de trabalho médico semanalmente, acelera a análise em ordens de magnitude e permite um acompanhamento mais eficaz dos pacientes, com o objetivo de reduzir a mortalidade de 20% para 10%. O sistema é projetado para escalabilidade horizontal para outras regiões e adaptabilidade a outras especialidades médicas, como oncologia e ginecologia, sem a necessidade de programação, apenas pela adição de novos esquemas de extração de dados.
🛡️⚡
Pare de pesquisar. Comece a hackear.
O MundiX é seu copiloto de pentest com IA: comandos exatos, análise de outputs e próximo passo na kill chain — em segundos.
Sem cartão para começar · Planos a partir de R$49/mês
A Síndrome Coronariana Aguda (SCA) representa a forma mais perigosa de doença cardíaca isquêmica. Pacientes que sofrem de SCA integram um grupo de altíssimo risco para futuras complicações cardiovasculares, com uma taxa de mortalidade que pode atingir 20% em até quatro anos. Para combater essa realidade, o Centro Nacional de Pesquisa Cardiológica (NMITSK) E.I. Chazova, com o apoio do Centro de Tecnologias para a Sociedade da Yandex Cloud, lançou um registro digital de pacientes que vivenciaram SCA. Essa iniciativa envolveu o processamento seguro de mais de 13 mil documentos médicos através de modelos de linguagem de grande porte (LLMs), fornecendo aos cardiologistas informações cruciais para pesquisa, monitoramento e prevenção de riscos.
A necessidade dessa solução surgiu da colaboração entre a equipe do Centro de Tecnologias para a Sociedade, especialistas do NMITSK e a Oficina Yandex Praktikum. Os cardiologistas buscaram auxílio para desenvolver um modelo preditivo de riscos de SCA. Para viabilizar essa tarefa com IA, era fundamental compreender a estrutura de coleta e análise de dados, bem como a natureza dos próprios dados. Anteriormente, a maior parte das informações sobre pacientes com SCA estava armazenada em formato bruto e não estruturado em documentos médicos. Em particular, o prontuário de alta, um documento não estruturado de 3 a 6 páginas, continha uma vasta quantidade de dados essenciais para a previsão, incluindo histórico médico, dados de exame físico, resultados de exames instrumentais e laboratoriais, e informações sobre tratamento cirúrgico e farmacológico. Embora um médico possa analisar o impacto do tratamento no curso da doença de um paciente específico, a agregação dessas informações em nível regional resultava em um registro nosológico regional. Essa base de dados, essencialmente uma grande tabela com inúmeros campos detalhando hospitalizações e o curso da doença, era utilizada para análise de dados e controle de qualidade do atendimento médico, para facilitar a comunicação entre a atenção primária e especializada, e para coleta de estatísticas médicas e pesquisa sobre o tratamento da SCA. Por muito tempo, o trabalho com esse registro era manual, consumindo horas semanais de especialistas qualificados, o que motivou a busca por uma solução automatizada.
A digitalização desse processo prometia benefícios significativos tanto para os médicos assistentes quanto para os pesquisadores. A transferência automática de dados de documentos permitiria um acompanhamento mais eficaz de novos pacientes diagnosticados com SCA. Um sistema automatizado poderia gerar alertas, como a falta de acompanhamento ambulatorial ou a não adesão a medicamentos prescritos, indicando a necessidade de intervenção para evitar a piora do prognóstico. Assim, a tarefa foi reformulada para a criação de um registro digital com preenchimento automático de dados. A região de Tula foi escolhida como piloto para a primeira fase do projeto, devido à sua robusta rede de cardiologia e um volume considerável de dados sobre SCA – mais de 13 mil documentos de centros vasculares entre 2021 e 2025. Para a criação deste registro digital, três etapas foram cruciais: a anonimização dos dados, a extração de características dos documentos para identificar entidades nomeadas e a montagem do registro com acesso granular, separando dados pessoais para médicos e estatísticas agregadas para pesquisa. A anonimização, em particular, exigiu atenção especial em termos de segurança da informação, utilizando métodos como a substituição de identificadores e a modificação ou distorção de dados, conforme regulamentado pelo RKN (Serviço Federal de Supervisão de Comunicações, Tecnologias de Informação e Mídia de Massa da Rússia).
Na prática, a solução implementada utiliza LLMs como YandexGPT Lite e Alice AI LLM, disponíveis na plataforma Yandex AI Studio. O sistema funciona como um construtor, adaptável a diversos tipos de documentos médicos. O processo envolve a definição de um esquema para o documento, a conversão dos arquivos para Markdown (formato nativo para LLMs), e a execução do processamento em múltiplos fluxos. Para garantir a previsibilidade e a consistência das respostas da LLM, são utilizados structured outputs, assegurando que o modelo retorne os dados no formato JSON especificado. A extração de dados pessoais, a geração de Unique Identifiers (UIDs) e a aplicação das estratégias de anonimização são realizadas de forma automatizada, com os resultados salvos para posterior análise. Um desafio particular foi a dificuldade da LLM em reter a posição exata das entidades no texto, o que foi superado salvando trechos de texto (snippets) juntamente com as entidades extraídas. A estratégia de anonimização com deterministic noise, utilizando uma salt (um segredo), foi empregada tanto para distorcer dados quanto para gerar identificadores únicos (UIDs) de forma determinística, permitindo a correlação de documentos de um mesmo indivíduo. A qualidade da anonimização foi rigorosamente validada através de dados sintéticos, ajustes finos com especialistas regionais e a revisão manual de centenas e, posteriormente, milhares de documentos. O resultado é um registro digital que economiza horas de trabalho médico semanalmente, acelera a análise em ordens de magnitude e permite um acompanhamento mais eficaz dos pacientes, com o objetivo de reduzir a mortalidade de 20% para 10%. O sistema é projetado para escalabilidade horizontal para outras regiões e adaptabilidade a outras especialidades médicas, como oncologia e ginecologia, sem a necessidade de programação, apenas pela adição de novos esquemas de extração de dados.
📤 Compartilhar & Baixar
🧰 Ferramentas recomendadas
Divulgação: alguns links são patrocinados. Podemos receber comissão se você comprar — sem custo extra para você. Só indicamos o que faz sentido para a comunidade.