Kling AI 3.0:ネイティブ音声、ストーリーボード、AIディレクター登場
KuaishouがKling AI 3.0をリリース。多言語ネイティブ音声、マルチショットストーリーボード、AIディレクターモードを搭載。4つの新モデルで15秒の映画品質AI動画生成を実現。
8件の記事
KuaishouがKling AI 3.0をリリース。多言語ネイティブ音声、マルチショットストーリーボード、AIディレクターモードを搭載。4つの新モデルで15秒の映画品質AI動画生成を実現。
NVIDIAがPersonaPlex-7Bをリリース。カスタマイズ可能なペルソナと0.2秒の遅延で、聞きながら同時に話せる無料のオープンソース全二重音声AI。
Alibabaがわずか3秒の音声から声をクローンできる新しいQwen AIモデルを公開。Photoshopのように画像を編集可能なレイヤーに分割するモデルも同時発表。
ByteDanceがSeedance 1.5 Proをリリース。組み込みの音声、ダイアログ、効果音を持つ動画を作成するAI動画生成ツール。中国語、英語、日本語を含む8言語に対応。
ロンドン拠点の音声AIスタートアップPolyAIが7億5000万ドルの評価額で8600万ドルを調達。カスタマーサービスコールセンター置き換え競争でSierraやDecagonと競合。
KuaishouがKling AI Video 2.6を発表、画期的な同時オーディオビジュアル生成機能を搭載。ナレーション、効果音、環境音を含む完全な動画をワンパスで作成。
ElevenLabsがマイケル・ケイン、マシュー・マコノヒー、ジュディ・ガーランドなどの著名人のAIクローン音声にアクセスできるIconic Voice Marketplaceをデビュー。
TIME誌がJensen Huang、Sam Altman、Demis Hassabisを含む8人のAIパイオニアを2025年パーソン・オブ・ザ・イヤーに選出。テクノロジーと社会を変革した彼らの役割を評価。