Alibabas Qwen kann jede Stimme aus 3 Sekunden Audio klonen
Alibaba veröffentlicht neue Qwen KI-Modelle, die Stimmen aus nur 3 Sekunden Audio klonen können, plus ein Bildbearbeitungsmodell, das Fotos in bearbeitbare Ebenen wie Photoshop aufteilt.
6 Artikel
Alibaba veröffentlicht neue Qwen KI-Modelle, die Stimmen aus nur 3 Sekunden Audio klonen können, plus ein Bildbearbeitungsmodell, das Fotos in bearbeitbare Ebenen wie Photoshop aufteilt.
ByteDance veröffentlicht Seedance 1.5 Pro, einen KI-Videogenerator, der Videos mit integrierter Sprache, Dialogen und Soundeffekten erstellt. Unterstützt 8 Sprachen einschließlich Mandarin, Englisch und Japanisch.
Das Londoner Voice-KI-Startup PolyAI sammelt 86 Mio. $ bei 750 Mio. $ Bewertung und konkurriert mit Sierra und Decagon im Rennen um den Ersatz von Kundenservice-Callcentern.
Kuaishou startet Kling AI Video 2.6 mit bahnbrechender simultaner Audio-Visual-Generierung. Erstellen Sie komplette Videos mit Sprachausgabe, Soundeffekten und Umgebungsaudio in einem Durchgang.
ElevenLabs präsentiert Iconic Voice Marketplace, der Nutzern Zugang zu KI-geklonten Stimmen von Prominenten wie Michael Caine, Matthew McConaughey, Judy Garland und mehr ermöglicht.
Das TIME-Magazin ehrt acht KI-Pioniere—darunter Jensen Huang, Sam Altman und Demis Hassabis—als Person des Jahres 2025 und würdigt ihre Rolle bei der Transformation von Technologie und Gesellschaft.