La inteligencia artificial está transformando radicalmente las herramientas de expresión visual, y uno de los desarrollos más prometedores en este campo es Sora, la tecnología más reciente presentada por OpenAI. Diseñada para convertir descripciones escritas en contenido visual de alto impacto, Sora representa un salto cualitativo en la generación de imágenes y video mediante lenguaje natural.

¿Qué es Sora?

Sora es una herramienta de generación de contenido visual que utiliza modelos de lenguaje avanzados para crear imágenes o videos hiperrealistas a partir de Prompts escritos por el usuario. Aunque originalmente se presentó como un modelo de texto a video, en su fase actual también permite producir imágenes estáticas con un nivel de detalle y fidelidad impresionante.

Lo que hace a Sora particularmente poderosa es su capacidad de interpretar descripciones complejas, estilos visuales y materiales con propiedades físicas específicas. Ya no es necesario tener conocimientos técnicos de diseño o animación para visualizar una idea: basta con describirla con precisión, y Sora la construye digitalmente.

Sora fue anunciado por primera vez el 15 de febrero de 2024. Sin embargo, su lanzamiento general al público, específicamente para suscriptores de ChatGPT Plus y Pro en la mayoría de los países (excepto algunas regiones de Europa y el Reino Unido), se realizó el 9 de diciembre de 2024.

Cómo funciona Sora.

El proceso se basa en el uso de modelos multimodales entrenados con una enorme cantidad de datos visuales y textuales. El usuario escribe un Prompt detallado, especificando el contenido, el estilo visual, los materiales, iluminación, composición y hasta emociones que desea transmitir. Con esta información, Sora genera una imagen o secuencia que se aproxima lo más posible a la intención original del usuario.

Este flujo de trabajo permite iterar fácilmente: si el resultado no es satisfactorio, se pueden ajustar ciertos elementos del Prompt y volver a generar la imagen, refinándola paso a paso hasta alcanzar el resultado deseado.

Alternativas a Sora.

Aunque Sora de OpenAI es una de las opciones más avanzadas y accesibles para la generación de contenido visual mediante IA, existen otras plataformas destacadas que ofrecen capacidades similares:

  • Veo 3 (Google).
    Veo 3 es la tercera generación del modelo de Inteligencia Artificial de Google diseñado para la generación de video. Ha sido desarrollado por Google DeepMind y representa un avance significativo en la creación de contenido audiovisual a partir de descripciones textuales (Prompts). Su capacidad para mantener coherencia temporal, realismo y variedad de estilos lo posiciona como uno de los rivales más importantes de Sora.
  • Stable Video Diffusion (Stability AI).
    Proyecto de código abierto centrado en la generación de video. Aunque aún en etapas experimentales, ofrece un alto grado de personalización y control técnico, especialmente útil para desarrolladores e investigadores.

En resumen, Sora de OpenAI no es solo una herramienta tecnológica, es una extensión del pensamiento visual, una nueva manera de traducir conceptos abstractos en realidades perceptibles. Desde la creación artística hasta la preservación cultural, Sora abre una puerta al futuro de la comunicación visual.


Referencia a este documento:

Víctor, F. (2025, junio 19).Sora de OpenAI: Generación de imágenes y video a partir de texto. OITSYS. Recuperado el [día] de [mes] de [año], de https://oitsys.com/2025/06/19/sora-de-openai-generacion-de-imagenes-y-video-a-partir-de-texto/


🚀 Laboratorio OITSYS.

Realizamos una prueba creativa utilizando el escudo de armas de la ciudad de Sahuayo, Michoacán como base. El objetivo fue transformar este símbolo en una versión hiperrealista en 3D, aprovechando el potencial de la Inteligencia Artificial Generativa (Generative-AI) para preservar y reinterpretar el patrimonio visual local.

Todo comenzó con la imagen original del escudo, que fue utilizada como referencia visual para alimentar un modelo de IA. A través de ChatGPT, se redactó una serie de instrucciones para posteriormente obtener un Prompt específico y detallado el cual utilizamos como Input en Sora, en el que se especificaban materiales como cromo pulido, esmaltes de colores, obsidiana, bronce, acero de Damasco y diamantes, todo dispuesto en un entorno de iluminación profesional y renderizado en estilo 8K. El nivel de detalle incluía texturas metálicas, inscripciones en bajo relieve y elementos vegetales con sombras suaves.

🧠 Técnica utilizada para la conversión.

🔧 1. Reconocimiento de patrones visuales.
La IA comienza analizando la imagen original para identificar los elementos esenciales:

  • Contornos y formas distintivas (como el casco, la tortuga, la serpiente, el árbol).
  • Tipografía mediante OCR, como las inscripciones “SAHUAYO 1530”, “PROGRESO”, “JUSTICIA”, “PATRIA”, y “TZACUATL AYOTL”.
  • Distribución heráldica y jerarquía simbólica.

🎨 2. Traducción de elementos planos a objetos 3D.
Con base en técnicas de Neural Rendering y Text-to-Image with Reference, el sistema convierte los trazos planos en:

  • Formas tridimensionales con volumen y profundidad.
  • Texturas realistas de metal, piedra o piel.
  • Iluminación, sombreado y relieves detallados.

Esto se logra gracias a modelos de difusión entrenados con millones de ejemplos hiperrealistas, capaces de predecir cómo luciría cada objeto si existiera físicamente.

✍️ 3. Conservación semántica del diseño.
A pesar del cambio estilístico, se conserva la esencia simbólica del escudo:

  • Colores equivalentes.
  • Disposición original de los símbolos.
  • Tipografía reinterpretada pero fiel.
  • Cinta inferior convertida a un listón metálico curvado, manteniendo su mensaje.

El proceso incluyó múltiples iteraciones. La primera imagen generada no capturaba completamente la visión estética y simbólica deseada. Por ello, se realizaron ajustes en el prompt, afinando las descripciones de materiales, relieves y proporciones de cada elemento. Cada iteración ofrecía una nueva oportunidad para equilibrar el realismo con la fidelidad histórica del escudo.

🎯 Resultado final

El resultado fue una imagen tridimensional de calidad casi fotográfica, en la que los reflejos, texturas y profundidad visual ofrecían una nueva forma de ver el símbolo sin alterar su identidad. Esta experiencia demuestra el enorme potencial de la inteligencia artificial como aliada en la preservación y resignificación cultural, especialmente cuando se trata de emblemas con tanta carga histórica como los escudos heráldicos mexicanos.


Escudo de armas de Sahuayo creado con Sora de OpenAI