IA de Código Aberto Reconhece 527 Sons em Tempo Real e Localmente

Um avanço significativo na inteligência artificial permite que dispositivos reconheçam uma vasta gama de sons ambientais de forma autônoma e em tempo real. O projeto ced.cpp, uma implementação em C++ da modelo CED desenvolvida pela Xiaomi, foi apresentado por Ettore Di Giacinto. Esta inovação promete revolucionar a forma como interagimos com a tecnologia, permitindo que computadores e outros dispositivos não apenas respondam a comandos de voz, mas também compreendam o ambiente ao seu redor através de sons cotidianos.

O grande diferencial do ced.cpp reside em sua capacidade de operar localmente, sem depender de serviços em nuvem ou de hardware de ponta. A adaptação da modelo original para rodar sem Python e sem a necessidade de GPUs potentes significa que a classificação de áudio acontece diretamente no dispositivo, mesmo em processadores mais modestos. O código, disponível no GitHub, processa fragmentos de áudio e os classifica em uma das 527 categorias do conjunto de dados AudioSet. Isso inclui desde fala e música até sons específicos como latidos de cachorro, passos, alarmes, aplausos, ruído de trânsito e o som característico de vidro quebrando. A capacidade de identificar múltiplos eventos sonoros simultaneamente, como voz, música e ruído externo, amplia ainda mais suas aplicações.

O foco em operação local e baixos requisitos de hardware torna o ced.cpp ideal para uma variedade de dispositivos. Uma versão compacta da modelo ocupa apenas 6 MB, sendo compatível com sistemas como o Raspberry Pi. Além disso, o projeto foi integrado ao LocalAI como um backend independente, permitindo o reconhecimento de eventos sonoros via API e em modo de streaming em tempo real. Os desenvolvedores relatam que o ced.cpp supera a implementação original em PyTorch em velocidade e consumo de memória, com acelerações de até 1,55 vezes e tempos de reconhecimento de áudio de aproximadamente 55 milissegundos em CPUs. As aplicações práticas são vastas, abrangendo desde sistemas de automação residencial e assistentes virtuais que reagem a sons como batidas na porta ou choro de bebê, até sistemas de monitoramento e robótica, onde a capacidade de 'ouvir' o ambiente sem enviar dados para a nuvem é crucial. Embora a modelo ainda não compreenda o contexto como um humano, sua capacidade de correlacionar sinais de áudio com classes conhecidas, aliada à sua acessibilidade e flexibilidade, posiciona o ced.cpp como uma base promissora para o desenvolvimento de dispositivos mais inteligentes e responsivos ao seu entorno.

Aprendendo Kali Linux: Teste de segurança, pentest e hacking ético

Hacking APIs: Breaking Web Application Programming Interfaces

Bloqueador USB de privacidade de porta USB para PC, notebook, bloco de laptop,

IA de Código Aberto Reconhece 527 Sons em Tempo Real e Localmente

Pare de pesquisar. Comece a hackear.

📤 Compartilhar & Baixar

🧰 Ferramentas recomendadas

Aprendendo Kali Linux: Teste de segurança, pentest e hacking ético

Gshield 2 em 1 Hub Extensor Conector USB-C + USB-A e Adaptador de Rede Ethernet LAN RJ45 com 3 Entradas USB 3.0 até 5 Gbps em Liga de Alumínio para Computador e Notebook, Cinza

Hacking APIs: Breaking Web Application Programming Interfaces

Gray Hat Hacking: The Ethical Hacker's Handbook, Sixth Edition

Bloqueador USB de privacidade de porta USB para PC, notebook, bloco de laptop,

📩 Newsletter MundiX

Artigos Relacionados

Experimento no Reddit: IA de busca confunde boato sobre Vance e Trump com notícia real

OpenAI Lança GPT-5.6 Sol: IA Revolucionária para Cibersegurança e Tarefas Complexas

Gshield 2 em 1 Hub Extensor Conector USB-C + USB-A e Adaptador de Rede Ethernet LAN RJ45 com 3 Entradas USB 3.0 até 5 Gbps em Liga de Alumínio para Computador e Notebook, Cinza

Gray Hat Hacking: The Ethical Hacker's Handbook, Sixth Edition