Solicitar una demo

Blog

Noticias del sector de la fotografía y el vídeo : Google I/O, OpenAI y otros

mayo 31, 2024  Michel Lacaille

En mayo de 2024, Google desveló un impresionante conjunto de iniciativas de IA destinadas a mejorar los casos de uso de fotos y vídeos. Hans Hartman, autor en Visual 1st, compartió recientemente sus 7 anuncios más relevantes para la industria de productos personalizados en un boletín informativo. Además, comparte algunas noticias muy interesantes que no deberías perderte en la industria. ¡Aquí tienes un resumen de todo lo que mencionó!

Google I/O

SynthID: La tecnología de marca de agua invisible de Google funcionará ahora con fotos, vídeos y música.

Proyecto Astra: Una nueva app que utiliza IA para identificar y proporcionar información sobre objetos que señalas o escuchas.

Veo: Una nueva herramienta que crea vídeos a partir de indicaciones, similar a Sora de OpenAI.

Imagen 3: La versión más reciente y de mayor calidad de la herramienta de creación de texto a imagen de Google.

Pregúntale a Fotos: Una nueva función de Google Fotos que te permite buscar y obtener información sobre tus fotos haciendo preguntas.

Google Lens: Ahora permite hacer preguntas utilizando vídeos, no solo imágenes.

Gemini en Android: Pronto, los usuarios de Android podrán arrastrar y soltar imágenes generadas por la IA en Gmail y otras aplicaciones. YouTube también permitirá a los usuarios tocar «Ask this video» para encontrar información en los vídeos.

OpenAI

Siri, Google Assistant y Alexa: ¡cuidado! OpenAI ha presentado un auténtico chatbot multimodal basado en su nuevo modelo de IA GPT-4o («o» significa «omni»). Puedes hablar con el bot, mostrarle imágenes o vídeos y obtener respuestas de voz en tiempo real.

En otras palabras, es un auténtico chatbot multimodal de IA, no sólo uno que convierte voz e imágenes en texto y viceversa. Puedes hacerle preguntas como «¿Qué marca de camisa lleva esta persona?» y obtener una respuesta hablada.

Sólo el tiempo dirá si esta interfaz centrada en la voz se popularizará. Por ahora, las indicaciones de texto para generar imágenes de IA son menos populares que las interfaces tradicionales, como los controles deslizantes y los menús.

Sensaria

Presentamos OnePoint, una nueva API que agiliza la gestión de pedidos de impresión bajo demanda, conectando varias instalaciones de impresión de Sensaria, Bay Photo y JONDO en todo el mundo.

(Anya Thrash, Vicepresidenta Ejecutiva de Marketing de Bay Photo/Sensaria, compartirá sus ideas en Visual 1st en nuestro panel sobre innovación en productos, tecnología y fabricación de impresión fotográfica).

Freepik y Magnific

Freepik ha adquirido Magnific, una empresa española que desarrolló hace tan solo cinco meses una solución de escalado, mejora y transformación de imágenes basada en IA. Se trata de la mayor adquisición de Freepik hasta la fecha, que se suma a las de EyeEm, Videvo, Original Mockups e Iconfinder.

Claid

El proveedor de API de comercio electrónico visual Claid ha anunciado una importante actualización. Incluye una nueva interfaz, mayor resolución, herramientas avanzadas de IA para crear fotos de productos de alta calidad y la integración de 15 herramientas de imagen de IA en una única API, lo que permite a los clientes de comercio electrónico automatizar todo su flujo de trabajo.

Manzana

En el reciente evento «Let Loose» de Apple, presentaron la aplicación Final Cut Camera, una potente aplicación de cámara de vídeo que ofrece más control que la integrada. Esta aplicación podría competir con aplicaciones avanzadas de terceros como Blackmagic Camera o Filmic Pro.

Una función destacada es Live Multicam, que permite a los usuarios conectar varios iPhones o iPads para grabar vídeo simultáneamente. Estas tomas se transfieren y sincronizan automáticamente con Final Cut Pro, lo que permite una edición fluida desde múltiples ángulos. En resumen, convierte tu iPad en un estudio de producción multicámara.

Profoto

Profoto, ganador de los anteriores premios Visual 1st Best of Show, ha anunciado Eclipse II, la segunda generación de su estación de fotografía de producto. Incluye equipos de iluminación de alta gama, una cámara Canon EOS R8 integrada, software de gestión del flujo de trabajo y una interfaz controlada por iPad. Este sistema está diseñado para capturar imágenes fijas y vídeos de calidad profesional de artículos como zapatos o accesorios con una mínima necesidad de conocimientos fotográficos. El nuevo sistema es más brillante, rápido e inteligente que el original desarrollado por StyleShoots, una empresa que Profoto adquirió en 2022.

Meta

Las herramientas de IA de Meta para anunciantes pueden ahora crear nuevas imágenes, no sólo fondos. Por ejemplo, si tienes una imagen de producto, como una taza de café, puedes sustituir el fondo y generar variaciones del propio producto, como mostrarlo desde distintos ángulos.

VSCO

VSCO presenta VSCO Hub, una solución de búsqueda de trabajo para que las empresas encuentren a los fotógrafos adecuados para sus proyectos. Esta nueva función incluye asistencia de búsqueda basada en IA para encontrar fotógrafos con requisitos específicos.

OpenAI

OpenAI ha lanzado un detector de deepfakes que puede identificar imágenes de IA de su modelo DALL-E con una precisión del 98,8%. Esta herramienta funciona bien porque OpenAI añade metadatos resistentes a la manipulación a las imágenes de DALL-E 3.

OpenAI

OpenAI está explorando formas de permitir a los usuarios generar porno con IA de forma responsable, asegurándose de que el contenido no viola leyes o derechos. Esta medida reconoce la importancia que para algunos usuarios tienen los contenidos creativos que implican sexualidad o desnudez.

TikTok

TikTok empezará a etiquetar los contenidos generados por inteligencia artificial con credenciales de contenido, lo que la convierte en la primera gran plataforma de redes sociales que admite el estándar abierto C2PA. Esta etiqueta se añadirá también a los contenidos con marca de agua de IA procedentes de fuera de TikTok.

Los rápidos avances en tecnología de IA están transformando drásticamente la industria de la fotografía y el vídeo. Gracias a las iniciativas de Google, OpenAI, Apple y otros, las capacidades de creación y gestión de contenidos visuales son cada vez más sofisticadas y accesibles.