LALAL.AI チュートリアル 2026:ボーカル除去・音源分離(ステム分離)を手順どおりに

著者: GenMediaLab 更新日: 9 分で読めます
LALAL.AIのチュートリアル:波形表示とステム分離のワークフロー画面

重要ポイント

  • LALAL.AIは10種類のステムに分離できます:ボーカル、ドラム、ベース、ピアノ、ギター、シンセ、ストリングス、ウッドウィンドなど
  • 無料プランでは10分まで処理でき、プレビューは可能です(ダウンロードは不可)
  • ソースファイルの品質が高いほど、分離結果もクリーンになります
  • ボーカルにはAndromeda、楽器ステム(ドラム・ベース・ギター・ピアノなど)にはPerseusを使います
  • カラオケ用トラック、リミックス、サンプリング、練習、コンテンツ制作などに使われます

このLALAL.AIチュートリアルでは、楽曲からボーカルを分離したり、AIで各楽器のステムを抽出したりする方法を学べます。1トラックあたりの処理は60秒以内で、MP3・WAV・FLAC・動画ファイルに対応し、ブラウザ・デスクトップ・スマホから、プロのスタジオに匹敵する分離結果を得られます。

カラオケ用トラックの作成、リミックス、楽器のサンプリング、分離したパートに合わせた練習など、用途に合わせて、基本的なボーカル除去から高度なマルチステム分離まで、この手順で一通り押さえられます。機能と料金の詳細は、LALAL.AIのレビューをご覧ください。他ツールとの比較は、2026年版・AI音声ジェネレーター比較をご覧ください。

LALAL.AIを無料で試す

AIによるステム分離を試すための無料10分を利用できます。購入前に品質をプレビューできます。

LALAL.AIを無料で試す →

必要なもの

LALAL.AIアカウント

無料で作成できます(登録にクレジットカードは不要です)

音声または動画ファイル

MP3、WAV、FLAC、MP4 — 分離したい曲や録音

有料プラン(ダウンロード用)

年払いで月額€6.75〜 — 無料アカウントはプレビューのみです

ステムの種類を理解する

LALAL.AIは、あらゆる音声から次の要素を抽出できます。

ステムの種類 抽出されるもの 向いている用途
Vocal and Instrumental バッキングから歌声・ラップを分離 カラオケ、リミックス
Voice and Noise 環境音から話し声を分離 ポッドキャストのノイズ除去
Drums ドラムセット全体(キック、スネア、ハイハットなど) サンプリング、練習
Bass ベースギターと低域 ベース練習、リミックス
Piano ピアノ・キーボード系の音 譜面起こし、練習
Electric Guitar エレキギターに特化 ギター練習
Acoustic Guitar アコギのパート アコースティック編曲
Synthesizer シンセ・電子音 EDM制作
Strings オーケストラの弦楽器 クラシックのサンプリング
Wind 金管・木管 ジャズ編曲

1回の分離でファイルは2つ:分離のたびに「その要素だけ」と「その要素以外のすべて」の両方が得られます。ボーカル/インストゥルメンタル分離では、アカペラ版とカラオケ版の両方が手に入ります。

1

ソースファイルを準備する

入ってくる品質がそのまま出ていきます。ソースが良いほど分離もクリーンになります。

おすすめのファイル形式(順位付き)

形式 品質 期待できる結果
WAV/FLAC(ロスレス) ★★★★★ 最良 — 最もクリーンな分離
320kbps MP3 ★★★★ 非常に良好 — アーティファクトは最小限
256kbps MP3 ★★★☆☆ 良好 — アーティファクトが出ることもあります
128kbps MP3 ★★☆☆☆ 許容範囲 — アーティファクトが目立ちます

高品質ファイルの入手先

  • 購入:iTunes、Amazon、Bandcamp(高音質になりやすい)
  • オリジナルCDをWAV/FLACにリッピング
  • プロデューサー提供のリリース(ステム付きならなお良い)
  • ストリーミングの取り回し音源は、多くの場合品質が落ちます

ファイルサイズの上限:無料アカウントは最大200MBまでアップロードできます。有料は最大2GBです。4分程度のWAVでも約40MB程度なので、通常は問題になりません。

2

ファイルをアップロードする

利用するプラットフォームを選び、音声または動画をアップロードします

Webの場合

  1. lalal.aiを開きます
  2. トップページの「アップロード」欄を探します
  3. アップロード前にステムの種類を選びます(重要です)
  4. 「ファイルを選択」をクリックするか、ファイルをドラッグ&ドロップします(英語UIでは「Select Files」と表示されます)
  5. アップロードが完了するまで待ちます

デスクトップアプリの場合

  1. LALAL.AIからMacまたはWindows用アプリをダウンロードします
  2. アプリを開き、ログインします
  3. ステムの種類を選びます
  4. ファイルをアプリにドラッグします
  5. アップロードが自動で始まります

モバイルアプリの場合

  1. App StoreまたはGoogle Playからアプリを入れます
  2. 開いてログインします
  3. ステムの種類を選びます
  4. 端末内のファイルを選びます
  5. LALAL.AIのサーバーへアップロードされます
3

設定を選ぶ

ニューラルネットワークと処理オプションを調整し、最適な結果を狙います

ニューラルネットワークの選択

設定アイコン(⚙️)をクリックして詳細オプションを開きます。

エンジン 向いている用途 おすすめ
Andromeda(最新) ボーカルとインストの分離 ボーカル向けの第一候補です
Perseus ドラム、ベース、ギター、ピアノ、シンセなど 楽器ステムにはこちらを推奨します
Phoenix 特定ジャンル・別バリエーションの結果 他で物足りないときに試す価値があります
Orion 一部の古い録音素材 レガシー音源では時々有効です

Enhanced Processing(強化処理)

Clear Cut

ステム間のブリードを抑えます。クリーンですがディテールが落ちることも。カラオケ用やサンプリング向きです。

Deep Extraction

ディテールを多く残しますが、わずかなブリードが残ることも。ニュアンス重視のリミックス向きです。

De-Echo(ボーカル用)

オリジナルにリバーブがかかっている場合:

  • よりクリーンなボーカル分離のためにDe-Echoをオンにします
  • ライブ録音や制作の厚みがある曲で特に有効です
4

結果をプレビューする

クレジットを使う前に必ずプレビューしましょう。ここが重要です。

プレビューの手順

  1. アップロード処理が終わると、各ステムの波形が表示されます
  2. 各ステムの再生ボタンを押します
  3. 各出力の30秒プレビューを聴きます
  4. スクラブして、曲のさまざまな位置を確認します

聴きどころ

分離したボーカルでは:

  • 声の明瞭さ
  • アーティファクトや「水っぽい」音
  • 楽器からのブリード(ドラムなど)

インストゥルメンタルでは:

  • 抜けた周波数(薄い音)
  • 残ったボーカルの成分
  • オリジナルと比べたバランス

結果が悪いときは:

  • 別のニューラルネットワークを試す
  • Enhanced Processingのモードを切り替える
  • ソースの音質が低くないか確認する
  • 別テイク・別バージョンの曲を試す

プレビューのコツ:コーラスや音が密集しているパートを重点的に聴きましょう。分離が難しいのはそこです。そこが問題なければ、他の部分も多くの場合問題ありません。

5

フルファイルを処理する

プレビューに満足したら、トラック全体を処理します

  1. **「Split in Full」**ボタンをクリックします
  2. 出力形式を選びます:
    • 入力と同じ(推奨)
    • または MP3、WAV、FLAC、OGG、AAC、AIFF から指定
  3. 処理を確定します
  4. 分離が終わるまで待ちます(目安は15〜60秒)

キューの種類

  • Fast Queue:すぐに処理(月間の分数を消費します)
  • Relaxed Queue:サーバーの空きを待って処理(有料プランでは無制限)
6

ステムをダウンロードする

分離した音声ファイルを取得します

処理が完了すると:

  1. 各ステムにダウンロードボタンが表示されます
  2. 個別にダウンロードするか
  3. **「Download All」**でZIPにまとめて取得できます

ファイル名の例

  • original_name_vocals.mp3 — ボーカルのみ
  • original_name_no_vocals.mp3 — インスト/カラオケ版

注意:ダウンロードには有料プランが必要です。無料アカウントはプレビューのみです。

実際に試してみますか?

分離の品質を試す無料10分が使えます。プラン購入前に結果をプレビューできます。

LALAL.AIで続ける →

実践例

カラオケ用トラック

曲をアップロード → 「Vocal and Instrumental」を選ぶ → Clear Cut → インストのステムをダウンロード

リミックス制作

アップロード → 「Vocal and Instrumental」 → Deep Extraction と De-Echo → ボーカルをDAWへ取り込む

ドラムのサンプリング

アップロード → 「Drums」を選ぶ → Deep Extraction → サンプラーでチョップして使う

ポッドキャストのクリーンアップ

音声をアップロード → 「Voice and Noise」 → 強めのノイズ除去 → 会話をクリアに

練習用トラックの作り方

楽器 選ぶステム 得られるもの
ベース練習 Bass ベースを抜いたトラック — 自分のベースで合奏
ギター練習 Electric or Acoustic Guitar ギターを抜いたトラックでジャム
ドラム練習 Drums ドラムを抜いたトラックで練習
ピアノ練習 Piano ピアノを抜いたバッキング

複数ステムの分離

複数の要素が必要なら、同じファイルを何度か処理します。

ステムの種類 得られるもの
1回目 ボーカルとインストゥルメンタル アカペラ + カラオケ用インスト
2回目 ドラム ドラム単体 + ドラムなし版
3回目 ベース ベース単体 + ベースなし版
4回目 ピアノ(曲に入っている場合) ピアノ単体 + ピアノなし版

分数の消費:1パスあたり、ファイルの長さと同じ分数がかかります。4分の曲を4種類に分けると合計16分です。ProプランのFast Queue 250分あれば、4ステムずつ処理する前提でもおおむね60曲分に相当します。

結果をさらに良くするには

ボーカルをよりクリーンに

最高品質のソース + Andromeda + De-Echo + Clear Cut

インストをより太く

Deep Extraction + Perseus + わずかなボーカル残りは許容 + ロスレスのソース

ドラムをより良く

クリアでパンチのあるドラムほど分離しやすいです。エレクトロニックはきれいに、ライブはブリードしやすい傾向があります

ジャンル別のヒント

ジャンル おすすめエンジン 処理モード メモ
ポップ Andromeda(ボーカル)/Perseus(楽器) Clear Cut 総合的にバランスが良いです
ロック Perseus(ギター・ドラム)/Andromeda(ボーカル) Deep Extraction ギターの質感を残しやすいです
エレクトロニック/EDM Perseus(シンセ)/Andromeda(ボーカル) Clear Cut シンセの分離がクリーンになりやすいです
ヒップホップ Andromeda Clear Cut + De-Echo ボーカルサンプルの明瞭さ向きです
クラシック Perseus(ストリングス・ウッドウィンド) Deep Extraction オーケストラの分離は難易度が高いです
ジャズ Perseus(楽器)/Phoenix(別案) Deep Extraction 生楽器の自然な響き向きです

よくあるトラブルと対処

症状 想定される原因 対処のヒント
「水っぽい」・位相っぽいボーカル 複雑な分離で生じるAI由来のアーティファクト 別のニューラルネットを試す、高音質のソースを使う、Deep Extractionを試す
インストが薄い ボーカル除去が強くかかり周波数が抜けた Deep Extraction、DAWでEQ、Phoenixエンジンを試す
ボーカルにドラムが乗る トランジェントが分離しにくい Clear Cut、後処理でトランジェント抑制、わずかなブリードは許容
処理に時間がかかりすぎる サーバー負荷やファイルが長い 優先したいときはFast Queue、オフピーク、長いファイルは分割

よくある質問

分離したステムを商用利用できますか?

LALAL.AIは処理後の音声に関する権利を付与しますが、元楽曲の著作権まで取得できるわけではありません。カバー、リミックス、サンプリングには、著作権者から適切なライセンスや許可が必要です。

無料で何分使えますか?

無料アカウントは10分まで処理でき、プレビューは可能です。分離結果は聴けますがダウンロードはできません。有料プランは年払いで月額€6.75〜からで、Relaxed Queueは無制限です。

曲の長さより多くの分数が消費されるのはなぜですか?

ステムの種類ごとに、曲の長さぶんの分数がかかります。4分の曲をボーカル分離とドラム分離の両方で処理すると、合計8分(各4分)です。

Fast QueueとRelaxed Queueの違いは何ですか?

品質は同じです。Fast Queueはすぐに処理しますが月間の分数に上限があります。Relaxed Queueはサーバーの空きを待ちます(目安5〜15分)が、有料プランでは無制限です。

動画ファイルからステムを分離できますか?

はい。MP4、MKV、AVIをそのままアップロードできます。LALAL.AIが音声を取り出して処理し、分離した音声トラックを返します。

どのニューラルネットワークを使えばよいですか?

ボーカル/インストの分離にはAndromeda、ドラム・ベース・ギター・ピアノ・シンセなどの楽器ステムにはPerseusを使います。結果がしっくりこないときはPhoenixを試してください。素材によって得意分野が異なります。

ステム分離ではLALAL.AIとDemucsのどちらが良いですか?

LALAL.AIとMetaのDemucsはアプローチが異なります。LALAL.AIは10種類のステム、使いやすいWeb/アプリ、セットアップ不要で速い処理が魅力です。Demucsは無料のOSSですがローカル環境が必要で、4ステム(ボーカル・ドラム・ベース・その他)に限られます。多くの利用者には、手軽さとステムの幅からLALAL.AIが向いています。

1曲の処理にどれくらい時間がかかりますか?

3〜4分の曲なら、Fast Queueでは目安15〜60秒です。有料で無制限のRelaxed Queueは、サーバー状況により目安5〜15分です。ファイルが長いほど、高品質フォーマットほど時間は伸びる傾向があります。

次のステップ

ステム分離ができるようになったら:

ジャンルを試す

さまざまなスタイルで試し、AIの得意不得意を把握しましょう

自分のワークフローを作る

用途に合わせて、毎回同じ手順を決めておくと楽です

DAWと組み合わせる

ステムを制作ソフトに取り込み、制作や編集に使います

VSTプラグインを試す

ProプランにはDAW連携用のVSTが含まれます

最初の分離を始める

AIによるステム分離を体験する無料10分が使えます。プラン購入前に品質をプレビューできます。

LALAL.AIを無料で試す →

さらに読む

この記事は役に立ちましたか?