NVIDIA PersonaPlex-7B: IA de Voz Full-Duplex em Código Aberto
NVIDIA lança PersonaPlex-7B, uma IA de voz full-duplex gratuita e em código aberto que ouve e fala simultaneamente, com personas personalizáveis e latência de 0,2s.
4 artigos
NVIDIA lança PersonaPlex-7B, uma IA de voz full-duplex gratuita e em código aberto que ouve e fala simultaneamente, com personas personalizáveis e latência de 0,2s.
ElevenLabs lança Scribe v2 com dois modelos especializados - Realtime para latência de 150ms em IA conversacional e Batch para transcrição de longa duração com detecção de entidades e diarização de 48 falantes.
A Alibaba lança novos modelos IA Qwen capazes de clonar vozes com apenas 3 segundos de áudio, mais um modelo de edição de imagens que divide fotos em camadas editáveis como o Photoshop.
ElevenLabs lança o Iconic Voice Marketplace permitindo que usuários acessem vozes clonadas com IA de celebridades como Michael Caine, Matthew McConaughey, Judy Garland e outros.