Tutorial LALAL.AI 2026: separar voces y stems paso a paso
Por GenMediaLab••Actualizado: •9 min de lectura
Puntos Clave
✓LALAL.AI puede separar 10 stems distintos: voces, batería, bajo, piano, guitarras, sintetizador, cuerdas y viento
✓El plan Free incluye 10 minutos de procesamiento con vista previa (sin descargas)
✓Cuanta más calidad tenga el archivo de origen, más limpias serán las separaciones
✓Usa Andromeda para voces y Perseus para stems de instrumentos (batería, bajo, guitarra, piano)
✓Los usos habituales incluyen pistas de karaoke, remixes, sampling, práctica y creación de contenido
En este tutorial de LALAL.AI aprenderás a separar voces de cualquier canción y a extraer stems de instrumentos con IA. El proceso tarda menos de 60 segundos por pista, funciona con MP3, WAV, FLAC y vídeo, y ofrece resultados comparables a un aislamiento de estudio profesional, todo desde el navegador, el escritorio o el móvil.
Si quieres crear pistas de karaoke, remixar, samplear instrumentos o practicar con partes aisladas, esta guía paso a paso cubre desde la eliminación básica de voces hasta la separación multistem avanzada. Para un desglose completo de funciones y precios, consulta nuestra reseña de LALAL.AI. Para ver cómo se compara LALAL.AI con otras herramientas, lee nuestra comparación de los mejores generadores de voz con IA de 2026.
Prueba LALAL.AI gratis
Obtén 10 minutos gratis para probar la separación de stems con IA. Revisa la calidad en vista previa antes de comprar.
MP3, WAV, FLAC, MP4: cualquier canción o grabación que quieras separar
Plan de pago (para descargas)
Desde 6,75 €/mes (anual); las cuentas gratuitas solo pueden usar la vista previa
Tipos de stem
LALAL.AI puede extraer estos elementos de cualquier audio:
Tipo de stem
Qué extrae
Ideal para
Vocal e instrumental
Canto o rap frente a la base
Karaoke, remixes
Voz y ruido
Voz frente a sonidos de fondo
Limpieza de podcasts
Batería
Kit completo (bombo, caja, charles)
Sampling, práctica
Bajo
Bajo eléctrico y graves
Práctica de bajo, remixes
Piano
Piano y teclados
Transcripción, práctica
Guitarra eléctrica
Guitarra eléctrica aislada
Práctica de guitarra
Guitarra acústica
Partes de guitarra acústica
Arreglos acústicos
Sintetizador
Sintes y sonidos electrónicos
Producción EDM
Cuerdas
Secciones de cuerdas orquestales
Sampling clásico
Viento
Metales y maderas
Arreglos de jazz
Dos archivos por separación: Cada separación genera el elemento aislado Y todo lo demás sin ese elemento. La separación vocal/instrumental te da a la vez un acapella y una base tipo karaoke.
1
Prepara el archivo de origen
Calidad de entrada, calidad de salida. Mejor fuente, separación más limpia.
Mejores formatos (ordenados):
Formato
Calidad
Resultado esperado
WAV/FLAC (sin pérdida)
★★★★★
Lo mejor: separación más limpia
MP3 320 kbps
★★★★☆
Muy bueno: pocos artefactos
MP3 256 kbps
★★★☆☆
Bueno: pueden aparecer artefactos
MP3 128 kbps
★★☆☆☆
Aceptable: artefactos perceptibles
Dónde conseguir archivos de calidad:
Compra en iTunes, Amazon o Bandcamp (mejor calidad)
CDs originales pasados a WAV/FLAC
Lanzamientos del productor (stems si existen)
Las copias desde streaming suelen ser de menor calidad
Límite de tamaño: Las cuentas gratuitas pueden subir hasta 200 MB; las de pago, hasta 2 GB. Un WAV de unos 4 minutos ronda los 40 MB, así que casi nunca es un problema.
Elige el tipo de stem antes de subir (¡importante!)
Pulsa Seleccionar archivos (Select Files) o arrastra el archivo
Espera a que termine la subida
En la app de escritorio:
Descarga la app para Mac o Windows desde LALAL.AI
Ábrela e inicia sesión
Selecciona el tipo de stem
Arrastra los archivos a la app
La subida empieza sola
En móvil:
Descárgala en App Store o Google Play
Ábrela e inicia sesión
Elige el tipo de stem
Selecciona el archivo en el dispositivo
Súbelo a los servidores de LALAL.AI
3
Ajusta la configuración
Red neuronal y opciones de procesamiento para el mejor resultado
Elección de red neuronal
Pulsa el icono de ajustes (⚙️) para ver opciones avanzadas:
Motor
Ideal para
Recomendación
Andromeda (última)
Separación vocal e instrumental
Lo mejor para voces: empieza aquí
Perseus
Batería, bajo, guitarra, piano, sinte
Recomendado para stems de instrumentos
Phoenix
Géneros concretos, resultados alternativos
Pruébalo si los demás motores fallan
Orion
Material antiguo concreto
Uso puntual en grabaciones antiguas
Procesamiento mejorado
Clear Cut
Reduce el bleed entre stems. Más limpio pero puede perder detalle. Ideal para karaoke y sampling.
Deep Extraction
Capta más matices pero puede haber algo de bleed. Mejor para remixes cuando quieres cada detalle.
De-Echo (voces)
Si el original lleva reverb:
Activa De-Echo para un aislamiento vocal más limpio
Muy útil en directos o mezclas muy cargadas
4
Vista previa de resultados
Siempre previsualiza antes de gastar minutos: es clave
Cómo previsualizar:
Tras procesar la subida verás las formas de onda de cada stem
Pulsa reproducir en cada stem
Escucha 30 segundos de vista previa de cada salida
Desplázate para oír distintas partes
En qué fijarte:
En la voz aislada:
Claridad de la voz
Artefactos o sonido «acuoso»
Bleed de instrumentos (sobre todo batería)
En el instrumental:
Frecuencias que faltan (sonido fino)
Restos de voz
Equilibrio general frente al original
Si el resultado es flojo:
Prueba otra red neuronal
Cambia el modo de procesamiento mejorado
Comprueba si el archivo de origen es de baja calidad
Prueba otra versión de la canción
Consejo de vista previa: Céntrate en el estribillo y en las partes más densas. Ahí la separación cuesta más. Si ahí suena bien, lo demás suele ir bien.
5
Procesa el archivo completo
¿Te convence la vista previa? Toca procesar la pista entera
Pulsa Dividir por completo (Split in Full en inglés)
Elige el formato de salida:
Igual que la entrada (recomendado)
O: MP3, WAV, FLAC, OGG, AAC, AIFF
Confirma el procesamiento
Espera la separación (normalmente 15–60 s)
Tipos de cola:
Cola rápida (Fast Queue): procesamiento inmediato (usa minutos del mes)
Cola relajada (Relaxed Queue): espera a que haya capacidad (ilimitada en planes de pago)
Sube la canción → elige Vocal e instrumental → Clear Cut → descarga el stem instrumental
Remix
Sube → Vocal e instrumental → Deep Extraction + De-Echo → importa las voces a tu DAW
Sampling de batería
Sube → Batería → Deep Extraction → trocea y samplea en tu sampler
Limpieza de podcast
Sube el audio → Voz y ruido → cancelación de ruido agresiva → diálogo limpio
Pistas para practicar
Instrumento
Stem a elegir
Qué obtienes
Practicar bajo
Bajo
Pista sin bajo para tocar encima
Practicar guitarra
Guitarra eléctrica o acústica
Base sin guitarra para improvisar
Practicar batería
Batería
Pista sin batería para ensayar
Practicar piano
Piano
Base sin piano
Varios stems en la misma canción
¿Necesitas más de un elemento? Procesa el mismo archivo varias veces:
Pasada
Tipo de stem
Qué obtienes
1.ª
Vocal e instrumental
Acapella + base karaoke
2.ª
Batería
Batería aislada + versión sin batería
3.ª
Bajo
Bajo aislado + versión sin bajo
4.ª
Piano (si está presente)
Piano aislado + versión sin piano
Consumo de minutos: Cada pasada consume minutos iguales a la duración del archivo. Una canción de 4 minutos en 4 tipos son 16 minutos en total. Los 250 minutos de la cola rápida (Fast Queue) del plan Pro permiten unas 60 canciones completas con separación en 4 stems cada una.
Sacar el máximo partido
Voces más limpias
Máxima calidad de origen + motor Andromeda + De-Echo + modo Clear Cut
Instrumentales más completos
Modo Deep Extraction + motor Perseus + aceptar leves restos de voz + origen sin pérdidas
Mejor batería
La batería clara y contundente se separa mejor. La electrónica sale muy limpia; la en vivo puede llevar bleed
Consejos por género:
Género
Motor recomendado
Modo de procesamiento
Notas
Pop
Andromeda (voces) / Perseus (instrumentos)
Clear Cut
Resultados muy sólidos en general
Rock
Perseus (guitarra, batería) / Andromeda (voces)
Deep Extraction
Conserva texturas de guitarra
Electrónica / EDM
Perseus (sinte) / Andromeda (voces)
Clear Cut
Separación limpia de sintes
Hip-hop
Andromeda
Clear Cut + De-Echo
Claridad para samples vocales
Clásica
Perseus (cuerdas, viento)
Deep Extraction
Separación orquestal compleja
Jazz
Perseus (instrumentos) / Phoenix (alternativa)
Deep Extraction
Sonidos acústicos naturales
Solución de problemas habituales
Problema
Causa
Soluciones
Voz «acuosa» o con fase
Artefactos de la IA en separaciones difíciles
Prueba otro motor; sube la calidad del origen; prueba Deep Extraction
Instrumental fino
La eliminación agresiva de voz se llevó frecuencias
Deep Extraction; EQ en el DAW; motor Phoenix
Batería que entra en la voz
Los transitorios cuestan de separar
Clear Cut; reducción de transitorios en post; acepta un poco de bleed
Tarda mucho en procesar
Mucha carga en el servidor o archivo largo
Cola rápida (Fast Queue) para prioridad; fuera de horas punta; divide archivos largos
Preguntas Frecuentes
¿Puedo usar los stems separados con fines comerciales?
LALAL.AI te otorga derechos sobre el audio procesado, pero no adquieres el copyright de la música original. Para covers, remixes o samples sigues necesitando licencias o permisos de los titulares.
¿Cuántos minutos gratis tengo?
Las cuentas gratuitas tienen 10 minutos de procesamiento con vista previa. Puedes escuchar los stems separados pero no descargarlos. Los planes de pago empiezan en 6,75 €/mes (anual) con cola relajada (Relaxed Queue) ilimitada.
¿Por qué mi canción gasta más minutos que su duración?
Cada tipo de separación de stem cuenta la duración completa de la canción. Una canción de 4 minutos con separación de voces y de batería son 8 minutos (4 + 4).
¿Qué diferencia hay entre la cola rápida y la cola relajada?
La calidad es la misma. La cola rápida (Fast Queue) procesa al momento pero tiene límite mensual de minutos. La cola relajada (Relaxed Queue) espera hueco en el servidor (suele ser 5–15 minutos) y es ilimitada en planes de pago.
¿Puedo separar stems de archivos de vídeo?
Sí. Sube MP4, MKV o AVI directamente. LALAL.AI extrae el audio, lo procesa y devuelve pistas de audio separadas.
¿Qué red neuronal debo usar?
Andromeda para separación vocal/instrumental y Perseus para stems de instrumentos (batería, bajo, guitarra, piano, sinte). Si no te convence, prueba Phoenix como alternativa. Cada motor rinde mejor según el material.
¿LALAL.AI es mejor que Demucs para separar stems?
LALAL.AI y Demucs (Meta) siguen enfoques distintos. LALAL.AI ofrece 10 tipos de stem, una interfaz web/app pulida y procesamiento rápido sin instalación. Demucs es gratis y de código abierto pero requiere instalación local y solo separa en 4 stems (voces, batería, bajo, otros). Para la mayoría, la comodidad de LALAL.AI y la variedad de stems lo hacen más práctico.
¿Cuánto tarda LALAL.AI en procesar una canción?
Una canción típica de 3–4 minutos suele tardar 15–60 segundos en la cola rápida (Fast Queue). La cola relajada (Relaxed Queue, ilimitada en planes de pago) suele tardar 5–15 minutos según la carga. Los archivos largos y los formatos de mayor calidad aumentan el tiempo.
Próximos pasos
Ya puedes separar stems:
Prueba distintos géneros
Explora estilos para ver qué puede y qué no puede la IA
Monta tu flujo
Define un proceso fiable para tu caso de uso
Llévalo al DAW
Importa stems a tu software de producción para crear
Prueba el plugin VST
El plan Pro incluye VST para integrarlo en el DAW
Empieza tu primera separación
Obtén 10 minutos gratis para probar la separación de stems con IA. Revisa la calidad en vista previa antes de elegir un plan.