José Carlos Botto Cayo
En los primeros años del siglo XXI soñábamos con cámaras más ligeras, con drones que volaran sobre las ciudades o con celulares que pudieran grabar sin límites. Hoy, en octubre de 2025, el sueño ha cambiado de forma: ya no buscamos registrar el mundo, sino inventarlo desde cero. Basta una línea escrita, una descripción emocional, una idea, y la inteligencia artificial la traduce en movimiento, color y sonido. Los nuevos creadores no solo graban: programan la realidad. El cine, la publicidad, el periodismo y la educación viven una transición silenciosa pero definitiva: el video ya no necesita del mundo físico para existir.
En ese contexto, la IA ha dejado de ser una curiosidad técnica para convertirse en el eje de una nueva cultura visual. Los algoritmos no solo procesan imágenes, sino que construyen mundos coherentes, con atmósferas, personajes y gestos que parecen haber nacido de la experiencia humana. Y aunque la perfección técnica aún es inalcanzable, lo que se ha logrado en solo un año de avance resulta deslumbrante. La generación de video por IA ha pasado de ser un experimento de laboratorio a una herramienta creativa al alcance de cualquiera, capaz de producir en minutos lo que antes requería un equipo de rodaje completo.
Los nuevos modelos que están reescribiendo la imagen en movimiento
En el panorama actual, Sora 2, el modelo de OpenAI lanzado este octubre, marca una ruptura decisiva. A diferencia de su antecesor, ya no se limita a crear secuencias visuales: incorpora audio sincronizado, control sobre personajes y cámaras virtuales, e incluso permite insertar el rostro de una persona —con su consentimiento— en el propio video generado. Su lanzamiento en versión móvil superó el millón de descargas en días, y con ello se inauguró una nueva forma de creación audiovisual: el usuario se convierte en protagonista de su propia narrativa digital.
Google responde con Veo 3.1, evolución directa de su modelo de video que ahora soporta clips más largos, coherencia narrativa y producción en formato vertical 9:16, ideal para redes sociales. Esta versión no solo ofrece mejor resolución, sino continuidad entre escenas, algo que las generaciones anteriores aún no conseguían. Veo 3.1 apunta a competir con Sora en el terreno del video narrativo, acercándose cada vez más al lenguaje cinematográfico.
Mientras tanto, en el ámbito académico surgen nombres que quizá no sean mediáticos, pero son el núcleo del futuro técnico. MAGI-1, SANA-Video y Waver son modelos que combinan eficiencia, coherencia temporal y realismo. MAGI-1, por ejemplo, genera videos largos sin aumentar el costo computacional, mientras SANA-Video produce clips de hasta un minuto en alta definición, optimizados para GPUs modernas. Estos desarrollos demuestran que la generación audiovisual ya no depende de grandes centros de datos: puede ejecutarse localmente, abriendo la puerta a una democratización real del video creado por IA.
Cada uno de estos avances comparte un mismo objetivo: la búsqueda de continuidad. Que los ojos, el cabello o las sombras de un personaje no cambien al pasar de un segundo al otro. Que el gesto humano, esa imperfección tan natural, empiece a respirarse en el algoritmo. En esa búsqueda, el arte y la ciencia se encuentran como pocas veces antes en la historia.
Vertientes creativas: de los cameos al guion automático
El video generado por inteligencia artificial ya no es solo una herramienta: es un nuevo lenguaje. Una de las tendencias más fascinantes es la aparición de narrativas guiadas por IA, donde el creador define la intención y el algoritmo propone arcos visuales, ambientes o desenlaces. En Sora 2, por ejemplo, basta indicar una emoción o una frase —“nostalgia en una ciudad lluviosa”— para obtener una secuencia con atmósfera coherente, sonido ambiente y ritmo visual.
Otra corriente emergente es la de los cameos digitales, en los que los usuarios pueden verse dentro del relato. Esta función, que combina modelado facial y animación procedural, está cambiando la noción de espectador: ya no se mira el video desde fuera, sino desde dentro de la escena. Lo que antes era fantasía de cine ahora se realiza en minutos desde un teléfono. Sin embargo, este poder creativo plantea dilemas éticos profundos sobre la identidad y el consentimiento.
Las técnicas mixtas también ganan terreno. Muchos creadores no generan videos desde cero, sino que usan la función “video-to-video”, que permite transformar grabaciones reales en escenas estilizadas, animadas o reinterpretadas. Una simple toma callejera puede convertirse en una obra surrealista o en una reconstrucción histórica. Estas mezclas de lo real y lo imaginario están definiendo una estética nueva: la del metarrealismo digital, donde todo puede ser transformado sin perder su esencia narrativa.
Finalmente, la IA se convierte en coautora de los guiones. Algunos sistemas pueden generar descripciones de cámara, ritmo narrativo e incluso diálogos. Ya existen modelos capaces de escribir, editar y animar un cortometraje completo sin intervención humana directa. Pero lo más interesante no es la sustitución del creador, sino su nueva función: el humano como director conceptual, quien elige el tono, el estilo, la emoción y deja que la máquina ejecute la coreografía visual.
Del cine al contenido social: un nuevo ecosistema audiovisual
El impacto de estas tecnologías atraviesa todas las escalas de la creación visual. En el cine independiente, los directores utilizan los generadores de video como herramientas de preproducción. Antes de grabar, pueden simular escenas, probar encuadres y visualizar la luz o la coreografía. Esto reduce costos, acelera la planificación y permite explorar ideas sin límites materiales.
En el ámbito educativo y documental, la IA ofrece posibilidades antes impensables: recrear civilizaciones desaparecidas, representar teorías científicas o reconstruir eventos históricos. Algunos museos ya usan video generado por IA para ofrecer experiencias inmersivas en las que el visitante puede “caminar” por lugares que nunca existieron físicamente. Esta intersección entre tecnología y pedagogía redefine la forma en que se transmite el conocimiento visual.
Las redes sociales también se benefician. La generación vertical de video, optimizada para plataformas como TikTok o Instagram, permite crear piezas de alto impacto visual sin estudio ni producción. Jóvenes realizadores, músicos o artistas visuales producen obras completas desde un teléfono, fusionando estilos cinematográficos y efectos digitales con fluidez y frescura. La estética del video corto alcanza un nuevo grado de sofisticación, acercando el arte digital al gran público.
Incluso el marketing audiovisual se está transformando. Las marcas comienzan a producir anuncios personalizados en los que el espectador aparece como protagonista, adaptando su rostro o su entorno a la narrativa. El sueño del mensaje único para cada persona está a un paso de concretarse, con implicancias tan poderosas como inquietantes para la privacidad.
Ética, autenticidad y el arte de no desaparecer
Como toda revolución, esta también trae sombras. El principal desafío ya no es técnico, sino ético y cultural. Con la facilidad para crear imágenes hiperrealistas, el riesgo de manipulación es enorme. Se han detectado ya videos falsos tan convincentes que requieren herramientas especializadas para su detección. Por eso, varios desarrolladores —entre ellos OpenAI— han incorporado marcas de agua visibles e invisibles, intentando frenar el uso indebido.
También surgen interrogantes sobre la autoría. Si un algoritmo crea una escena, ¿a quién pertenece? ¿al programador, al usuario o a la máquina? Estas preguntas, que hace poco parecían filosóficas, hoy son jurídicas y comerciales. En respuesta, distintas legislaciones ya estudian mecanismos de certificación y trazabilidad de contenido audiovisual generado por IA.
El otro gran reto es humano. En un mundo donde todo puede simularse, ¿qué valor conserva lo auténtico? Los artistas, cineastas y periodistas deben redefinir el papel de su oficio. Pero, como ha ocurrido siempre con la tecnología, la respuesta no está en oponerse, sino en adaptarse. La creatividad sigue siendo humana: lo que cambia es el instrumento.
Así llegamos a un punto de inflexión cultural. El video ya no se limita a registrar el mundo visible; ahora imagina mundos posibles. Las cámaras fueron nuestros ojos, pero la inteligencia artificial está empezando a ser nuestra memoria y nuestra imaginación combinadas. El desafío de esta década no será aprender a usar estas herramientas, sino a darles propósito, ética y belleza. En esa tarea, más que nunca, el arte y la conciencia deberán caminar juntos.

