Glossario della Generazione Video con IA: Termini Essenziali Spiegati

Di GenMediaLab • • 10 min di lettura
Visuale glossario video IA

Ottimo per: marketer di prodotto, team operativi, scrittori di agenzie e influencer che hanno bisogno di un riferimento rapido durante la scrittura di contenuti alimentati da IA.

A

Avatar IA

Un personaggio digitale generato dall’intelligenza artificiale che può parlare e muoversi in modo realistico. Utilizzato nei video per sostituire attori umani.

Audio Inpainting

Usare l’IA per riempire vuoti, rimuovere suoni indesiderati o riparare sezioni danneggiate di registrazioni audio mantenendo un flusso naturale.

Sintesi Audio

Il processo di generazione di un parlato simile a quello umano usando l’IA invece di registrare la voce di una persona reale.

Formato d’Aspetto

Il rapporto larghezza-altezza di un video (es. 16:9 per widescreen, 9:16 per verticale/mobile).

B

Rimozione dello Sfondo

Tecnologia IA che rimuove automaticamente lo sfondo dai filmati video, permettendoti di sostituirlo con scene personalizzate.

Generazione in Batch

Creare piĂą video simultaneamente da script o modelli diversi.

Brand Kit

Una raccolta di loghi, colori, font e risorse utilizzate per mantenere un branding coerente tra i video.

C

Scala CFG (Classifier-Free Guidance)

Un parametro che controlla quanto da vicino l’IA segue il tuo prompt. Valori più alti creano output più fedeli alla tua descrizione; valori più bassi permettono più libertà creativa.

Checkpoint

Uno stato salvato dei pesi addestrati di un modello IA. Checkpoint diversi possono produrre stili visivi o capacitĂ  diverse.

Clonazione Vocale

Creare una copia sintetica della voce di una persona che può pronunciare qualsiasi testo mantenendo le caratteristiche della voce originale.

ControlNet

Una tecnica che dĂ  controllo preciso sulla generazione di immagini e video IA usando immagini di riferimento per pose, bordi, mappe di profonditĂ  o altre guide visive.

Avatar Personalizzato

Un avatar IA personalizzato creato da filmati di una persona specifica, utilizzato per rappresentare la loro somiglianza digitale.

D

Deepfake

Tecnologia di manipolazione video che scambia volti o altera contenuti. Controversa quando usata senza consenso (non la stessa cosa degli avatar IA etici).

Modello di Diffusione

L’architettura IA che alimenta i moderni generatori video come Sora, Runway e Kling. Funziona imparando a rimuovere il rumore da staticità casuale fino a quando emerge un’immagine o video coerente.

Umano Digitale

Un altro termine per avatar IA - una persona generata dal computer che sembra e agisce umana.

Doppiaggio

Sostituire l’audio originale in un video con una lingua diversa sincronizzando i movimenti delle labbra.

E

Casi Limite

Scenari insoliti o rari dove l’IA potrebbe non performare in modo ottimale (es. pronunce non comuni).

Formato di Esportazione

Il tipo di file in cui il tuo video viene salvato (es. MP4, MOV, WebM).

F

Scambio Volto

Tecnologia che sostituisce il volto di una persona con quello di un’altra in un video.

Fine-Tuning

Il processo di prendere un modello IA pre-addestrato e addestrarlo ulteriormente su dati specifici per specializzarlo per un compito, stile o soggetto particolare.

Frame Rate

Quante immagini (frame) vengono mostrate al secondo in un video. Lo standard è 24-30 fps.

Frontend/Backend

Frontend si riferisce a ciò che gli utenti vedono, backend si riferisce all’elaborazione IA che avviene dietro le quinte.

G

IA Generativa

IA che crea nuovi contenuti (immagini, video, audio) piuttosto che solo analizzare contenuti esistenti.

Controllo Gestuale

La capacitĂ  di programmare i movimenti delle mani e il linguaggio del corpo di un avatar.

Green Screen

Una tecnica dove uno sfondo di colore solido (di solito verde) viene sostituito con altre immagini. L’IA può farlo automaticamente ora.

H

Allucinazione

Quando l’IA genera contenuti falsi, privi di senso o fattualmente incorretti. Nei video, questo potrebbe apparire come mani distorte, fisica impossibile o volti che si trasformano in modo innaturale.

Iper-Realistico

Contenuti generati da IA estremamente difficili da distinguere da filmati reali.

HeyGen

Una popolare piattaforma di video avatar IA nota per la clonazione vocale e la facilità d’uso.

I

Immagine-a-Video (img2vid)

Generare contenuti video da una singola immagine statica. L’IA anima l’immagine statica, aggiungendo movimento, movimento della telecamera o animazione dei personaggi.

Inferenza

Il processo di esecuzione di un modello IA addestrato per generare output. Quando crei un video con uno strumento IA, il processo di generazione si chiama inferenza.

Inpainting

Riempire o modificare parti di un frame video usando l’IA.

Avatar Istantaneo

Avatar IA pre-fatti disponibili immediatamente senza addestramento personalizzato.

J

J-Cut

Una tecnica di montaggio dove l’audio dalla scena successiva inizia a suonare prima che finisca il visivo corrente. Utile per far sentire le scene generate da IA più naturali.

Riduzione Jitter

Filtri di stabilizzazione che rimuovono piccole vibrazioni della telecamera o rumore frame-to-frame nei filmati renderizzati da IA.

K

Keyframe

Un frame che segna un cambiamento nell’animazione, posizione della telecamera o effetto. Molti editor video IA ti permettono di impostare keyframe per pose dell’avatar o movimenti della telecamera.

Knowledge Cutoff

La data più recente su cui un modello di IA generativa è stato addestrato. Importante quando gli strumenti IA citano fatti all’interno dei tuoi script.

L

Latenza

Il ritardo tra l’avvio della generazione video e la ricezione del prodotto finito.

Sincronizzazione Labiale

Corrispondere i movimenti della bocca di un avatar alle parole pronunciate. Critico per video realistici.

LLM (Large Language Model)

Modelli IA come GPT che possono aiutare a scrivere script e generare contenuti video.

LoRA (Low-Rank Adaptation)

Una tecnica di fine-tuning leggera che addestra piccoli moduli adattatori invece dell’intero modello IA. Popolare per aggiungere stili personalizzati, personaggi o concetti ai generatori video.

M

Motion Capture

Registrare movimenti umani reali per far muovere gli avatar in modo piĂą naturale.

Supporto Multi-Lingua

La capacitĂ  di creare video in molte lingue diverse con pronuncia nativa.

MP4

Il formato di file video piĂą comune, ampiamente compatibile con tutte le piattaforme.

Multimodale

Modelli IA che possono comprendere e generare più tipi di contenuti—testo, immagini, audio e video—all’interno di un singolo sistema. Esempi includono GPT-4V e Gemini.

N

Elaborazione del Linguaggio Naturale (NLP)

L’abilità dell’IA di comprendere e generare linguaggio umano - usata per l’analisi degli script e le voci fuori campo.

Prompt Negativo

Istruzioni che dicono all’IA cosa NON includere nel contenuto generato. Usato per evitare elementi indesiderati come immagini sfocate, arti extra o stili specifici.

Rete Neurale

L’architettura IA che alimenta la generazione di avatar e la sintesi vocale.

O

Overdub

Sostituire dialoghi esistenti con nuovo parlato generato da IA mantenendo il timing intatto.

Outpainting

Estendere scene video oltre i loro bordi originali usando l’IA per immaginare i pixel extra.

P

Foto-Realistico

QualitĂ  visiva che assomiglia strettamente a fotografia o filmati video reali.

Tono

L’altezza o la bassezza di una voce. Può essere regolato nella generazione vocale IA.

Preset

Impostazioni o modelli pre-configurati che accelerano la creazione video.

Q

Soglia di QualitĂ 

Uno standard minimo (risoluzione, bitrate o punteggio di confidenza IA) che deve essere raggiunto prima che il rendering finisca.

Quantizzazione

Comprimere modelli IA così funzionano più velocemente su GPU consumer, a volte a costo di dettagli fini.

R

Rendering

Il processo di generazione del file video finale dal tuo script e impostazioni.

Risoluzione

QualitĂ  video misurata in pixel (es. 1080p, 4K). PiĂą alta = migliore qualitĂ  ma file piĂą grandi.

S

Script

Il testo che il tuo avatar IA pronuncerĂ  nel video.

Separazione degli Stemi

Tecnologia IA che divide una traccia audio mista in componenti individuali (stemi) come voci, batteria, basso e altri strumenti. Usata per remix, karaoke e creazione di contenuti.

Media Sintetici

Contenuti (video, audio, immagini) creati o modificati dall’IA.

Synthesia

Una piattaforma leader di video avatar IA focalizzata sulle imprese.

T

Coerenza Temporale

Quanto fluidamente e coerentemente un video generato da IA mantiene elementi visivi tra i frame. Una scarsa coerenza temporale causa sfarfallio, oggetti che si trasformano o personaggi che cambiano aspetto a metĂ  video.

Testo-a-Musica

Sistemi IA che generano composizioni musicali complete da descrizioni testuali. Piattaforme come Suno e Udio possono creare canzoni con voci, strumenti e produzione da prompt semplici.

Text-to-Speech (TTS)

Convertire testo scritto in audio parlato usando voci IA.

Testo-a-Video

Generare contenuti video da descrizioni testuali o script.

Modello

Layout video pre-progettati che accelerano il processo di creazione.

Anteprima

L’immagine di anteprima mostrata prima che un video venga riprodotto.

U

Upscaling

Usare l’IA per aumentare la risoluzione e la qualità del video.

V

Video-a-Video (vid2vid)

Trasformare filmati video esistenti usando l’IA per cambiarne lo stile, l’aspetto o il contenuto preservando il movimento e la struttura originali.

Clonazione Vocale

Creare una versione sintetica della voce di qualcuno che può pronunciare qualsiasi testo.

Modulazione Vocale

Regolare le caratteristiche vocali come tono, velocitĂ  ed emozione.

VTT/SRT

Formati di file sottotitoli per aggiungere didascalie ai video.

W

Filigrana

Un logo o testo sovrapposto su un video, spesso usato nelle prove gratuite o per proteggere i contenuti.

Workflow

La serie di passaggi dallo script al video finito.

X

XR (RealtĂ  Estesa)

Un termine ombrello per AR, VR e realtĂ  mista. Gli avatar IA sono spesso portati in esperienze XR.

Sottotitoli XML

File di testo temporizzati (come TTML) esportati da strumenti di sottotitolazione IA per workflow broadcast.

Y

Spazio Colore YUV

Il modello di colore che la maggior parte delle piattaforme di streaming usa. Conoscerlo aiuta quando si esportano filmati IA per corrispondere agli standard broadcast.

YouTube Shorts

Video verticali, sotto i 60 secondi. Molti generatori video IA includono preset per Shorts.

Z

Generazione Zero-Shot

Produrre un video o voce convincente senza fornire filmati o audio di esempio del soggetto target.

Import Registrazione Zoom

Caricare una riunione Zoom in un editor IA così può tagliare, tradurre o trasformarla in clip scriptate.

Conclusione

Questo glossario copre i termini essenziali che incontrerai quando lavori con strumenti di generazione video IA. Man mano che la tecnologia evolve, emergeranno nuovi termini - manterremo questa guida aggiornata!

Aggiungi questa pagina ai preferiti per riferimento rapido durante la creazione dei tuoi video IA.


Manca un termine? Contattaci per suggerire aggiunte!

Questo articolo ti è stato utile?