Le 10 sfide della scrittura di un video AI
L'età dell'oro della sceneggiatura inizia in salita.
Manuale di sceneggiatura è la newsletter per sceneggiatori, filmmaker, creator, appassionati di cinema e audiovisivo in generale. Iscriviti gratuitamente alla newsletter. Riceverai in regalo il pdf del Manuale pratico di sceneggiatura. Visita www.manualedisceneggiatura.com per scoprire tutti i servizi e le offerte (l’offerta migliore di sempre è valida fino al 31/7).
LE 10 SFIDE DELLA SCRITTURA DI UN VIDEO AI
Con l’intelligenza artificiale, tutto il lavoro di produzione di un filmato è notevolmente semplificato. Ma non la fase di scrittura, su cui ricadono responsabilità nuove.
In aggiunta a queste responsabilità, i limiti tecnologici dell’attuale intelligenza artificiale generativa consiglieranno ai più di attendere una nuova generazione di software prima di avventurarsi in questo campo.
Questo post è per i pionieri che vogliono conquistare il “west” prima della costruzione della ferrovia.
Ecco le 10 sfide che dovrete affrontare:
LA PRECISIONE DELLA SCRITTURA
La scrittura cinematografica deve essere precisa, se vuole trasmettere delle immagini vivide al lettore-esecutore, ma di solito, per non appesantire il testo, descrive dei mondi con poche, chiare pennellate.
Tanti dettagli vengono soltanto suggeriti, con rapidi riferimenti, a chi si occuperà della realizzazione: gli attori, ma anche i costumisti, gli scenografi, i truccatori. Nel cinema tradizionale, tutti questi soggetti colmano sul set le lacune e la relativa vaghezza degli aspetti visuali della sceneggiatura.
L’intelligenza artificiale non ha il talento e la competenza di quei professionisti e deve quindi essere istruita con maggiore precisione.
La soluzione: scrivere istruzioni estremamente accurate e, nel tempo, cercare di stringere rapporti con quei professionisti il cui know-how potrebbe arricchire i vostri prompt. Truccatori, costumisti, scenografi, possono tutti diventare collaboratori dello sceneggiatore, proprio come lo erano dei registi.
LA DIFFICOLTA’ DELLA COERENZA VISIVA
Attualmente le piattaforme, anche accedendo a costosi piani a pagamento, consentono di realizzare soltanto brevi video, che andrebbero poi uniti per creare un racconto più lungo. Ma lo stesso personaggio, o lo stesso ambiente, raramente mantengono lo stesso identico aspetto in due scene distinte.
La soluzione: concentrarsi per adesso su video brevi oppure, nel caso di video un po’ più lunghi, prediligere storie in cui personaggi e location non ricorrono in scene differenti. Se un personaggio deve riapparire in un secondo momento, una piccola furbizia consiste nell’utilizzare in momenti diversi due frammenti di un’unica scena (all’interno della quale la coerenza visiva è garantita).
LA DURATA DELLE SINGOLE SCENE
Un tempo si diceva che un grande film era composto da 60 grandi scene di 2 minuti. Ma Veo 3 di Google, che considero di gran lunga l’opzione migliore per ottenere dei filmati di qualità fotorealistica nella fusione di ambienti e personaggi, e nell’elaborazione dei loro movimenti e dialoghi, permette soltanto di creare video molto brevi, di circa 8 secondi l’uno. Questo aspetto impone un ritmo alla narrazione che è molto difficile da gestire.
La soluzione: anche qui, concentrarsi per adesso su video brevi, perche un cambio di scena ogni 8 secondi può essere sopportato dallo spettatore solo per 1-2 minuti. All’interno della scena, limitare il dialogo al minimo per non costringere il software a velocizzare la “delivery” della battuta, compromettendone il realismo.
ACCESSIBILITA’ DELLA TECNOLOGIA
Questo è forse lo scoglio più duro. I risultati migliori si ottengono attraverso tentativi ed errori,con miglioramenti progressivi. Ma se ogni errore vi costa una quota sostanziale del prezioso credito mensile sulla piattaforma, verso il giorno 5 del mese sarete costretti a prendervi una pausa fino all’inizio del mese successivo.
Questa situazione, fortunatamente, dovrebbe evolvere rapidamente. Il prossimo momento chiave sarà il lancio di Google AI Ultra in Italia, che comunque prevederà ancora delle limitazioni nell’utilizzo da parte dei singoli utenti.
La soluzione: pregare. Io l’ho fatto e Google mi ha concesso del credito extra (sempre poco, eh!). In aggiunta alle preghiere: non sprecare credito con tentativi prematuri (scene appena abbozzate con dialoghi di prova), concentrarsi su pochi lavori al mese e spendere tutto il credito su quelli. Se avete committenti in attesa, ricompensate la loro pazienza con degli sconti e dei servizi extra.
MOVIMENTI E LINGUAGGIO ROBOTICI
Sono ancora un problema, anche se Veo 3 di Google rappresenta un salto avanti impressionante sotto questo profilo.
I concorrenti (soprattutto Luma, Kling, Runway) sono abbastanza indietro in questo campo e, per questo motivo, unito al loro minor realismo fotografico, non rappresentano un’alternativa credibile nella creazione di video iper-realistici.
Lo dico con tristezza perché avere più piattaforme all’altezza della situazione consentirebbe di aggirare l’ostacolo delle restrizioni all’uso mensile dei singoli servizi.
Ma anche Veo 3 fa errori con i movimenti. E ne fa ancora di più con il linguaggio, che non è sufficientemente naturale in una discreta percentuale dei suoi video. E ogni battuta mal pronunciata è un video da scartare, e credito mensile gettato alle ortiche.
La soluzione: Descrivere movimenti semplici nel prompt, precisare bene il tono del dialogo e la sua evoluzione, e naturalmente scrivere battute brevi.
CREARE VIDEO IN ITALIANO
Capita spesso di specificare nel prompt che la battuta che il personaggio sta per pronunciare “è in italiano” e ciononostante ritrovarsi come risultato un video in inglese (altro credito buttato!).
Questo perché, quando queste piattaforme traducono il nostro italiano nel “loro” inglese, automaticamente traducono anche la battuta.
A volte il chiarimento inserito nel prompt funziona, a volte no. E anche quando funziona, il dialogo italiano è mediamente meno realistico nel tono. Bisogna quindi fare più tentativi per ottenere il “ciak” giusto, e questo brucerà un po’ del nostro credito.
La soluzione: Ripetere fino alla ridondanza che il video deve essere in lingua italiana. Una menzione all’inizio (“Video in lingua italiana”) e poi una specificazione subito prima del testo del dialogo (“il personaggio dice in italiano…”) e una terza di riepilogo in chiusura, in una sezione finale dopo la descrizione della scena che può essere introdotta dalle parole “Output desiderato: un video in italiano che…”. Per rafforzare il concetto è possibile aggiungere che il personaggio parla con un leggero accento regionale.
COSTI DEI SERVIZI
I crediti da spendere nella realizzazione anche solo di un breve video di qualità professionale, considerando che per ogni scena il tentativo che va a buon fine può facilmente essere il decimo o il ventesimo, non sono indifferenti.
Se si tratta di un video per uso personale, valutate voi il valore che aggiunge alla vostra attività o alla vostra vita, e quale sia un costo giustificabile della sua realizzazione.
Se si tratta di un video realizzato su commissione, ricordiamoci sempre che tutta questa nascente industria si fonda su una spettacolare riduzione dei costi di produzione.
Un cliente ragionevole sarà al vostro fianco in questo piccolo investimento e ben lieto di spendere un po’ di più nella fase di riscrittura-correzione a fronte di un risparmio enorme su tutto il resto. La componente costi è destinata peraltro a migliorare rapidamente.
La soluzione: ci sono alcuni trucchi possibili per ridurre il budget di realizzazione. Uno che mi pare sfuggire ai più è la possibilità di inserire porzioni di video tradizionali all’interno di video elaborati con l’AI.
Esempio: prima di vedere il personaggio digitale che cucina un piatto di spaghetti, potrebbe esserci un “establishing shot” che mostra la sua casa in campagna. Quella piccola scena iniziale non deve essere necessariamente realizzata con Veo 3. Potrebbe benissimo essere uno “stock video” offerto da quelle stesse piattaforme. E va da sé che questo non inficia affatto la qualità finale del video. Semmai il contrario, dato che inseriamo un’immagine reale al posto di una artificiale. È insomma un modo intelligente di ridurre i costi.
SOVRIMPRESSIONI E SOTTOTITOLI
Per sottotitoli, intendo qui i sottotitoli di traduzione che vengano impressi sulle immagini come si fa nel cinema tradizionale, non quelli esterni e automatici che potete visualizzare su Youtube. E per sovrimpressioni intendo le indicazioni, sempre impresse sul filmato, circa il luogo e il momento in cui si situa l’azione che osserviamo.
Con tutte le meraviglie dell’intelligenza artificiale generativa, è stupefacente che questa piccola cosa continui a essere un problema. Non solo nei video ma anche nelle foto. Se menzionate una scritta nel prompt, L’AI non sarà in grado di replicarla.
La soluzione: fatene a meno.
LE LINEE GUIDA DELLE PIATTAFORME.
Non voglio usare la parola censura, ma ci siamo capiti. Si può senz’altro argomentare che, nel rilascio di una tecnologia del genere, alcuni paletti vadano messi.
Ma la realtà è che vi vedrete censurare (for lack of a better word) le battute più innocue e le immagini più innocenti. E ovviamente se il tono della scena richiede una parola più forte, sarà un problema. Se vi serve un nudo, buona fortuna.
Censure a parte, trovano mille modi di complicare la vita degli utenti. Se vi serve una voce femminile per un lip sync, vi verrà detto che non esistono voci femminili o maschili.
Bisognerà essere creativi fino a quando la concorrenza tra piattaforme si sposterà anche su questo terreno.
La soluzione:
COMPETENZE MULTIDISCIPLINARI
Chiudo ampliando una riflessione già presente nel punto 1. Il cinema è un lavoro di squadra. Qui invece lo sceneggiatore è da solo. Allora non sarà male acquisire le competenze di base degli altri mestieri del cinema. O avvalersi di collaboratori.
La fortuna è che lo sceneggiatore è da sempre “il regista sulla carta”, quello a cui è richiesta sin dall’inizio una visione complessiva del film e una comprensione almeno istintiva del lavoro degli attori, del montatore, del direttore della fotografia. La forma mentis ce l’abbiamo già.
La sfortuna è che le nostre eventuali lacune non saranno compensate dagli specialisti. È il prezzo da pagare per realizzare in pieno la fantasia della Nouvelle Vague, quella dell’auteur-réalisateur.
La soluzione: studiare.
www.manualedisceneggiatura.com