La inteligencia artificial está transformando radicalmente las herramientas de expresión visual, y uno de los desarrollos más prometedores en este campo es Sora, la tecnología más reciente presentada por OpenAI. Diseñada para convertir descripciones escritas en contenido visual de alto impacto, Sora representa un salto cualitativo en la generación de imágenes y video mediante lenguaje natural.

¿Qué es Sora?

Sora es una herramienta de generación de contenido visual que utiliza modelos de lenguaje avanzados para crear imágenes o videos hiperrealistas a partir de Prompts escritos por el usuario. Aunque originalmente se presentó como un modelo de texto a video, en su fase actual también permite producir imágenes estáticas con un nivel de detalle y fidelidad impresionante.

Lo que hace a Sora particularmente poderosa es su capacidad de interpretar descripciones complejas, estilos visuales y materiales con propiedades físicas específicas. Ya no es necesario tener conocimientos técnicos de diseño o animación para visualizar una idea: basta con describirla con precisión, y Sora la construye digitalmente.

Sora fue anunciado por primera vez el 15 de febrero de 2024. Sin embargo, su lanzamiento general al público, específicamente para suscriptores de ChatGPT Plus y Pro en la mayoría de los países (excepto algunas regiones de Europa y el Reino Unido), se realizó el 9 de diciembre de 2024.

Cómo funciona Sora.

El proceso se basa en el uso de modelos multimodales entrenados con una enorme cantidad de datos visuales y textuales. El usuario escribe un Prompt detallado, especificando el contenido, el estilo visual, los materiales, iluminación, composición y hasta emociones que desea transmitir. Con esta información, Sora genera una imagen o secuencia que se aproxima lo más posible a la intención original del usuario.

Este flujo de trabajo permite iterar fácilmente: si el resultado no es satisfactorio, se pueden ajustar ciertos elementos del Prompt y volver a generar la imagen, refinándola paso a paso hasta alcanzar el resultado deseado.

Alternativas a Sora.

Aunque Sora de OpenAI es una de las opciones más avanzadas y accesibles para la generación de contenido visual mediante IA, existen otras plataformas destacadas que ofrecen capacidades similares:

  • Veo 3 (Google).
    Veo 3 es la tercera generación del modelo de Inteligencia Artificial de Google diseñado para la generación de video. Ha sido desarrollado por Google DeepMind y representa un avance significativo en la creación de contenido audiovisual a partir de descripciones textuales (Prompts). Su capacidad para mantener coherencia temporal, realismo y variedad de estilos lo posiciona como uno de los rivales más importantes de Sora.
  • Stable Video Diffusion (Stability AI).
    Proyecto de código abierto centrado en la generación de video. Aunque aún en etapas experimentales, ofrece un alto grado de personalización y control técnico, especialmente útil para desarrolladores e investigadores.

En resumen, Sora de OpenAI no es solo una herramienta tecnológica, es una extensión del pensamiento visual, una nueva manera de traducir conceptos abstractos en realidades perceptibles. Desde la creación artística hasta la preservación cultural, Sora abre una puerta al futuro de la comunicación visual.


Referencia a este documento:

Víctor, F. (2025, junio 19).Sora de OpenAI: Generación de imágenes y video a partir de texto. OITSYS. Recuperado el [día] de [mes] de [año], de https://oitsys.com/2025/06/19/sora-de-openai-generacion-de-imagenes-y-video-a-partir-de-texto/


🚀 Laboratorio OITSYS.

Realice unas pruebas utilizando el escudo de armas de la ciudad de Sahuayo, Michoacán como base creativa. El objetivo fue generar una imagen hiperrealista en 3D del escudo, usando únicamente el emblema original como referencia visual y un prompt creado con asistencia de ChatGPT.

La referencia:
Se partió del escudo oficial de la ciudad, que fue utilizado como imagen base para alimentar el modelo.

El Prompt:
A través de ChatGPT, se redactó una descripción minuciosa, especificando materiales como cromo pulido, esmaltes de colores, obsidiana, bronce, acero de Damasco y diamantes, todo dispuesto en un entorno de iluminación profesional y con renderizado estilo 8K. El nivel de detalle incluía la textura de los metales, las inscripciones en bajo relieve, y los elementos vegetales con sombras suaves.

Las Iteraciones:
El primer resultado generado por Sora no cumplió completamente con la visión estética y simbólica esperada. Por ello, se ajustaron los parámetros del prompt, afinando la descripción de cada símbolo y el tratamiento de los materiales, hasta lograr una imagen que evocara tanto el esplendor del escudo como su valor cultural.

El resultado:
La imagen final fue una representación tridimensional del escudo con calidad casi fotográfica, en la que los reflejos, texturas y profundidad visual ofrecían una nueva interpretación del símbolo, sin distorsionar su identidad. El resultado sirvió como una muestra poderosa de cómo la IA puede ser una aliada para reinterpretar y preservar elementos del patrimonio local.


Escudo de armas de Sahuayo creado con Sora de OpenAI