Esta es la regla sobre la que se construye todo el workflow. Interiorizala antes de tocar cualquier herramienta.
La mayoría construye en este orden: guión → prompts de imagen → generar escenas → grabar voz → sincronizar todo al final.
Ese orden es el problema.
Cuando las imágenes van primero y la voz después, estás forzando dos cosas que no fueron hechas la una para la otra. El resultado se siente fuera de lugar. Los espectadores no saben nombrar por qué, simplemente se van.
Dalo vuelta: voz en off primero, escenas después, siempre.
El motivo: una voz en off terminada tiene pausas naturales entre oraciones. Esas pausas son tus puntos de corte. Cada escena empieza y termina en una pausa. Cada corte nace del ritmo de la voz, no de una decisión adivinada después.
Ese ritmo —no el arte, no las herramientas— es lo que retiene al espectador.
Cada paso de abajo existe para servir a este orden.