ARTICULO

El Formato TikTok de 3 Slides que Convierte: Completion Rate 100%

El formato de 3 slides que convierte mejor que cualquier video largo en TikTok — y el pipeline de AI que lo genera en 5 minutos.

2026-05-28

El insight que cambia todo

Hay una métrica que Adrià Martinez descubrió y que debería estar tatuada en la pared de todo growth marketer: los carruseles de 3 slides en TikTok tienen un completion rate cercano al 100%. Los de 10 slides pierden al 80% de la audiencia antes de llegar al final.

Parece una obviedad — menos slides, más completion — pero lo que lo vuelve un hallazgo brutal es la segunda parte: Martinez construyó un sistema que genera 5 carruseles de 3 slides en 5 minutos, con Claude Haiku, GPT Image 2 y prompts fijos en código. Batch de 5 en 5 minutos. Manual: 2 minutos más por post para overlay text en TikTok.

No es "AI te hace el contenido". Es "armé una fábrica donde la AI es un engranaje y yo soy el capataz que decide qué sale y qué no".

El formato de 3 slides: anatomía de un loop perfecto

El formato que Martinez usa es quirúrgico. Tres slides que cuentan una historia completa sin necesidad de voz, sin hooks forzados, sin gritar "comprá esto":

Slide 1: Una chica con acne, llorando. Texto overlay: "1 day after he left".

Slide 2: La misma chica, piel completamente limpia. Texto overlay: "6 months after".

Slide 3: Una pantalla de iPhone mostrando un DM de Instagram con una notificación de streak de 200 días. Texto overlay: "9 months later..."

Ninguno de los slides menciona el producto. El producto — una marca de skincare — aparece como el contexto invisible que el viewer conecta solo. La historia no se interrumpe para vender. La historia ES la venta.

Este es el patrón viral que Martinez identificó: la audiencia de TikTok completa la narrativa por su cuenta, y cuando lo hace, el engagement se dispara. No es un anuncio. Es un cliffhanger emocional que se resuelve en 3 frames.

Por qué 3 slides y no 10

El dato duro: un carrusel de 3 slides tiene completion rate de prácticamente 100%. Uno de 10 slides retiene apenas al 20% de los viewers en el último slide. La diferencia no es lineal — es exponencial.

La razón psicológica es simple: TikTok entrena a los users para consumir contenido en fragmentos de 3 segundos. Tres slides son un arco narrativo completo que cabe en el attention span nativo de la plataforma. Diez slides es una miniserie que nadie pidió.

Pero el insight operativo es más importante: si necesitás 10 slides para contar tu historia, tu historia es demasiado larga, no tus slides. El formato de 3 te fuerza a destilar. Lo que no suma, sobra.

La fábrica: por qué los prompts van fijos en código

Martinez cometió un error al principio que le enseñó la lección más cara del proyecto: dejar que la AI generara los prompts de imagen. El resultado fue un desastre estético — las imágenes variaban en estilo, iluminación y composición entre batch y batch. No había consistencia visual, y en TikTok, la consistencia es marca.

La solución: prompts fijos en código. Nada de "generate a prompt for a sad girl with acne". Literalmente templates hardcodeados:

` Foto selfie de chica de 22 años, iluminación natural, llorando, cámara frontal, piel con acné visible, aesthetic TikTok 2024, raw, sin filtro `

El mismo prompt base para cada slide del batch, cambiando solo las variables: expresión facial, estado de la piel, contexto de fondo. Claude Haiku genera las variables — edad, nombre, storyline — pero la cáscara visual del prompt nunca cambia.

Esto es lo que separa un sistema que escala de uno que hace ruido: las variables son dinámicas, los prompts no. El diseñador sos vos, la AI es producción.

El pipeline técnico: Claude Haiku + GPT Image 2

El stack es sorprendentemente minimalista:

Claude Haiku genera variables narrativas: nombre de la protagonista, storyline emocional, edad, contexto. Esto toma segundos. Haiku es barato y rápido — no necesitás Opus para generar 10 variables por batch.

Templates fijos reciben las variables y arman el prompt final de imagen. El template no se toca. Solo se reemplazan los placeholders.

GPT Image 2 renderiza las imágenes. Martinez elige GPT Image 2 sobre Midjourney o DALL-E porque el consistency entre imágenes generadas con el mismo prompt template es superior.

Batch de 5 carruseles se genera en 5 minutos. 15 imágenes totales (3 slides × 5 carruseles).

Manual: Martinez revisa cada batch, selecciona los mejores, y agrega overlay text en TikTok (2 minutos por post). El overlay text es crítico — es lo que convierte una galería de imágenes en una historia.

El resultado neto: 5 posts publicables en 7 minutos de trabajo humano. A 3 posts por día, eso es cobertura casi completa de la semana en menos de una hora.

El DM viral: por qué no menciona el producto

El tercer slide del formato — la pantalla de iPhone con un DM — es lo que Martinez llama "el gancho invisible". El DM nunca dice "comprá X producto". Dice algo como:

> "omg you look so different... what happened??" > (streak: 200 days 🔥)

El viewer ve la transformación, ve el DM, ve el streak de 200 días. Conecta solo: algo pasó en esos 6 meses. Esa "algo" es el producto, pero el viewer llega solo a la conclusión. Nadie se la impuso.

Este principio es transferible a cualquier producto. La clave no es mostrar el producto. Es mostrar la transformación y dejar que la audiencia pregunte. Cuando preguntan, ya están vendidos.

Cómo implementar tu propia fábrica de carruseles

Lo que Martinez armó se puede replicar en cualquier nicho. Los componentes:

Claude Haiku para variables: escribí 20 variaciones de storyline en tu nicho. Dale a Haiku instrucciones para generar combinaciones nuevas respetando la estructura.
3 templates de prompt fijos: uno para cada slide del carrusel. Nunca los cambies. Solo reemplazá las variables que Haiku genera.
GPT Image 2 para renderizado: por consistency entre imágenes.
Revisión humana obligatoria: el batch sale, vos elegís. La AI propone, vos disponés.
Overlay text manual: 2 minutos por post. No automatices esto — es donde ponés el timing narrativo que la AI no puede calibrar.

El costo total por batch de 5: centavos en API calls + 7 minutos de tu tiempo.

Lo que esto significa para el contenido en 2026

Hay dos lecturas de lo que hizo Martinez. La superficial: "AI te hace contenido viral en 5 minutos". La real: "la AI elimina el cuello de botella de producción, y lo que queda es pura estrategia creativa".

En 2026, cualquiera puede generar 100 carruseles por hora con AI. Lo que no cualquiera puede hacer es entender por qué 3 slides funcionan mejor que 10, por qué el DM no debe mencionar el producto, por qué los prompts tienen que ser fijos en código.

La ventaja no está en usar AI. Está en saber exactamente qué pedirle.

— Ariel Di Stefano