Compartir

16 de mayo de 2025

Cartwheel avanza en la animación de personajes con la API de Gemini

Jonathan Jarvis

Cofundador y director de tecnología

Andrew Carr

Cofundador y científico jefe

Vishal Dharmadhikari

DevRel de IA

Elemento hero de la presentación de Carrusel

Cartwheel avanza en la animación de personajes con la API de Gemini

Cartwheel está a la vanguardia de la animación de nueva generación y ofrece una plataforma en la que las entradas de lenguaje natural (p.ej., "saltar", "girar en un baile de salsa") dirigen las acciones de los personajes. Esta innovación mejora la forma en que los creadores crean animaciones para videos, juegos, publicidad y redes sociales. Cartwheel integra Imagen 3 para un diseño intuitivo de texto a personaje y aprovecha la versión preliminar de Gemini 2.5 Pro para desarrollar algoritmos sofisticados específicos de animación, explorar bases de código complejas y acelerar la optimización de la plataforma, lo que permite a los usuarios expandir su narración creativa.

Supera los obstáculos de I+D en el movimiento 3D generativo

El desarrollo de una plataforma de animación de vanguardia requiere no solo herramientas de diseño fáciles de usar, sino también innovación continua en los algoritmos de backend y una administración eficiente de la base de código. Cartwheel enfrentó el desafío de crear prototipos e implementar rápidamente funciones de animación complejas, optimizar su extensa base de código para mejorar el rendimiento y permitir que los desarrolladores comprendan y contribuyan rápidamente a un sistema a gran escala. Necesitaban un socio de IA potente para potenciar sus esfuerzos de desarrollo.

Cómo Cartwheel usa Imagen 3 y la versión preliminar de Gemini 2.5 Pro

Cartwheel usa la API de Gemini para mejorar su canalización de creación para el usuario y ayudar a sus procesos de desarrollo internos.

  • Conceptualización de personajes impulsada por IA con Imagen 3: Cartwheel integra las capacidades de texto a imagen de Imagen 3, lo que permite a los creadores usar instrucciones de texto para conceptualizar y generar imágenes de personajes únicas directamente en la plataforma. Estos personajes diseñados a medida se pueden animar con lenguaje natural y, luego, exportarse completamente preparados para software de edición en 3D estándar de la industria, como Maya o Blender, lo que permite la integración en entornos de producción profesionales.
  • Asistencia a I+D y optimización con la versión preliminar de Gemini 2.5 Pro: El equipo de Cartwheel usa la versión preliminar de Gemini 2.5 Pro de forma interna para respaldar sus flujos de trabajo de ingeniería e investigación:
    • Desarrollo de algoritmos: La versión preliminar de Gemini 2.5 Pro se usa para ayudar a desarrollar funciones específicas de animación, incluidos algoritmos para el desenfoque de movimiento para la síntesis de datos, pirámides de Laplace para la combinación y la IK automática (cinemática inversa) para la colocación en el editor.
    • Exploración y depuración de código: El equipo usa la versión preliminar de Gemini 2.5 Pro para explorar bases de código complejas, generar ideas para nuevos experimentos y ayudar a depurar casos extremos de manera eficiente, como errores complejos de rotación de la cámara.
    • Aprovecha el contexto largo para las operaciones de la base de código: Las capacidades de contexto largo de la versión preliminar de Gemini 2.5 Pro se usan para operar en toda la base de código de Cartwheel. Esto permite a los desarrolladores, por ejemplo, incorporar bases de código nuevas (como el frontend) en el contexto para ayudar a agregar funciones o hacer preguntas de alto nivel sobre la arquitectura y la funcionalidad del sistema.

Fortalece los flujos de trabajo de animación

Con el uso de la Versión preliminar de Gemini 2.5 Pro para ayudar con el desarrollo de algoritmos, la exploración de código y la depuración, Cartwheel busca mejorar sus procesos de desarrollo y acelerar la optimización de la plataforma. La integración de Imagen 3 les brinda a los usuarios una forma optimizada de generar imágenes de personajes a partir de texto, mientras que la Versión preliminar de Gemini 2.5 Pro sirve como herramienta para ayudar a los desarrolladores a compilar la tecnología subyacente. Estas integraciones respaldan los objetivos de Cartwheel de hacer que los flujos de trabajo de animación sean más rápidos y accesibles, lo que permite usos como los siguientes:

  • Aceleración de la creación de recursos para juegos y videos, lo que permite que los equipos se enfoquen en el diseño principal.
  • Facilitar la generación eficiente de contenido de marketing y redes sociales

“La animación es una de las formas más puras de sacar una historia de tu cabeza y mostrársela al mundo. Estamos creando herramientas para que eso sea más fácil y accesible para todos”.

- Jonathan Jarvis, director general y cofundador, Cartwheel

Cómo crear el futuro de la animación

La integración de Imagen 3 y la versión preliminar de Gemini 2.5 Pro de Cartwheel destaca cómo se puede aplicar la IA de Google para habilitar nuevas funciones para los usuarios y ayudar con el complejo trabajo de desarrollo necesario para crear herramientas de nueva generación.

Explora la documentación de la API de Gemini, obtén información sobre la Imagen 3 y comienza a usar Google AI Studio.

Cartwheel participa en el Fondo de Futuros de IA de Google, que invierte en startups ambiciosas y colabora con ellas para desarrollar lo próximo en IA.