Novatecs · edición 2026 · 9 páginas

Gemini Omni: guía completa

El modelo de Google que entiende física real, edita videos que tú grabaste y te obedece con un solo mensaje.

Anunciado en Google I/O el 19 de mayo de 2026. Gemini Omni es una familia de modelos multimodales hecha por DeepMind. La diferencia clave: no es solo otro generador de video. Google lo llama "world model" — entiende gravedad, energía cinética y dinámica de fluidos, y le pega mejor a cómo se mueve el mundo de verdad.

22 min de lecturaPDF 2.6 MB1,120 descargasIntermedio

Para quiénCreadores · marketers · godines que producen contenido

RequisitoPlan Google AI Plus / Pro / Ultra (o gratis vía YouTube Shorts/Create)

Lo que vas a aprender

Las 4 funciones de la guía

Cada función ocupa dos páginas en el PDF: concepto, sintaxis y argumentos en una, ejemplos prácticos, errores comunes, trucos pro y prompts mágicos para IA en la otra.

Texto → Video

Modo 01 · El básico

Le describes la escena en palabras y te entrega el clip. Cuatro ingredientes: quién, qué hace, dónde + cómo se ve, cómo se mueve la cámara. Si das los cuatro, el output mejora muchísimo.

Básicotexto · prompt → clip

Imagen + Texto → Video

Modo 02 · El versátil

Le pasas una imagen y un prompt — la convierte en video. La imagen puede ser el primer frame (arranca con ella) o el último frame (termina ahí, Omni inventa lo que pasó antes). El truco que casi nadie usa.

Intermedioimagen · prompt → clip

Video + Texto → Edición

Modo 03 · Lo nuevo · rompe el juego

Le pasas un video que TÚ grabaste y un prompt. Cambia ropa, ilumina, agrega objetos, extiende la toma. Conversacional: cada cambio se acumula sobre el anterior sin re-especificar todo. Esto no se había visto en ninguna otra IA hasta ahora.

Avanzadovideo real · prompt → edit

5 tips para que no salga feo

Tips + errores comunes

Movimiento de cámara explícito, audio explícito, iluminación clara, encadena en el mismo chat, 10 segundos máx. Y errores que te van a pasar: manos raras, texto mal, caras de famosos, pedir demasiado por turno. Un cambio por turno — la edición conversacional es la feature, úsala.

PrácticoLa regla de oro

Antes de empezar

3 cosas antes de seguir

Cuenta Google y mayor de 18 años

Disponible en todos los idiomas y mercados donde corre Gemini. Si estás en LATAM, sí aplica.

Plan Google AI Plus, Pro o Ultra

En la app de Gemini o en Google Flow. Si no quieres pagar: Omni aparece gratis dentro de YouTube Shorts y en la app YouTube Create. Mismo modelo, menos controles avanzados — perfecto para empezar.

Material para empezar

Si no tienes material grabado, empieza con Modo 1 (texto → video). Si ya tienes una foto, Modo 2. Si tienes video real que necesitas arreglar, Modo 3. La regla rápida: si vas a grabar — usa Modo 3 después. Si no — Modo 1.

Hasta aquí llegamos

Si vas a producir contenido en 2026 — empieza aquí.

World model que entiende física real, edita video que tú grabaste, sincroniza audio nativo y recuerda contexto entre turnos. Cinco pasos en 30 segundos para entrar — pega gratis en YouTube Shorts/Create si no quieres pagar todavía.

Qué sigue

Empieza con Modo 1 si no tienes material.Texto → video. B-roll, productos, hooks visuales, animación. Ideal para arrancar cualquier video desde cero. Los 5 ejemplos del PDF (producto rotando, B-roll cinematográfico, hook viral, animación cartoon, comercial de servicio) son listos para copiar.

Si ya grabaste y necesitas arreglarlo, salta al Modo 3.Cambiar ropa sin re-grabar, cambiar la hora del día, agregar elementos a la escena, cambiar el clima, extender una toma. Aquí es donde ahorras horas — y donde Omni rompe el juego contra Sora y Veo.

Para personaje consistente: el truco del último frame.En videos largos, sube primero una foto, genera un clip de 10s, y usa el último frame de ese clip como primer frame del siguiente (Modo 02). El rostro se mantiene parecido entre tomas. Esto encadena tomas sin re-especificar al personaje cada vez.

Más guías

Gemini Omni: guía completa

Las 4 funciones de la guía

Texto → Video

Imagen + Texto → Video

Video + Texto → Edición

5 tips para que no salga feo

3 cosas antes de seguir

Si vas a producir contenido en 2026 — empieza aquí.

Otras guías que te pueden servir

Arma tu equipo con IA

Claude para pequeños negocios

Live Artefacts

Meta TRIBE v2: predice tu cerebro

5 funciones de Excel para experto

Arma tu equipo con IA

Claude para pequeños negocios

Live Artefacts

Meta TRIBE v2: predice tu cerebro

5 funciones de Excel para experto