알리바바의 Qwen, 3초 오디오로 모든 음성 복제 가능
알리바바가 단 3초의 오디오로 음성을 복제할 수 있는 새로운 Qwen AI 모델을 출시했으며, Photoshop처럼 사진을 편집 가능한 레이어로 분할하는 이미지 편집 모델도 출시했습니다.
5개의 기사
알리바바가 단 3초의 오디오로 음성을 복제할 수 있는 새로운 Qwen AI 모델을 출시했으며, Photoshop처럼 사진을 편집 가능한 레이어로 분할하는 이미지 편집 모델도 출시했습니다.
ByteDance가 Seedance 1.5 Pro를 출시했습니다. 내장된 음성, 대화, 사운드 효과로 비디오를 생성하는 AI 비디오 생성기입니다. 중국어, 영어, 일본어를 포함한 8개 언어를 지원합니다.
런던 기반 음성 AI 스타트업 PolyAI가 7억 5천만 달러 기업가치로 8,600만 달러를 유치했습니다. Sierra 및 Decagon과 고객 서비스 콜센터 대체 경쟁에서 경쟁하고 있습니다.
Kuaishou가 획기적인 동시 오디오-비주얼 생성과 함께 Kling AI Video 2.6을 출시했습니다. 한 번에 음성, 음향 효과, 앰비언트 오디오가 포함된 완전한 비디오를 만드세요.
ElevenLabs가 Michael Caine, Matthew McConaughey, Judy Garland 등 유명인들의 AI 복제 음성에 대한 액세스를 제공하는 Iconic Voice Marketplace를 데뷔합니다.