NVIDIA PersonaPlex-7B: IA de voz full-duplex de código abierto
NVIDIA lanza PersonaPlex-7B, una IA de voz full-duplex gratuita y de código abierto que escucha y habla simultáneamente con personajes personalizables y latencia de 0,2 s.
4 artículos
NVIDIA lanza PersonaPlex-7B, una IA de voz full-duplex gratuita y de código abierto que escucha y habla simultáneamente con personajes personalizables y latencia de 0,2 s.
ElevenLabs lanza Scribe v2 con dos modelos especializados - Realtime para latencia de 150ms en IA conversacional y Batch para transcripción de formato largo con detección de entidades y diarización de 48 hablantes.
Alibaba lanza nuevos modelos IA Qwen capaces de clonar voces con solo 3 segundos de audio, más un modelo de edición de imágenes que divide fotos en capas editables como Photoshop.
ElevenLabs presenta Iconic Voice Marketplace permitiendo a los usuarios acceder a voces clonadas con IA de celebridades como Michael Caine, Matthew McConaughey, Judy Garland y más.