Demande une demo

Blog

Actualités de l’industrie photo et vidéo : Google I/O, OpenAI et autres

mai 31, 2024  Michel Lacaille

En mai 2024, Google a dévoilé un ensemble impressionnant d’initiatives en matière d’IA visant à améliorer les cas d’utilisation des photos et des vidéos. Hans Hartman, auteur chez Visual 1st, a récemment partagé ses 7 annonces les plus pertinentes pour l’industrie des produits personnalisés dans une newsletter. En outre, il partage des nouvelles très intéressantes que vous ne devriez pas manquer dans l’industrie. Voici un résumé de tout ce qu’il a mentionné !

Google I/O

SynthID: le filigrane invisible de Google fonctionne désormais avec les photos, les vidéos et la musique.

Projet Astra: Une nouvelle application qui utilise l’IA pour identifier et fournir des informations sur les objets que vous pointez du doigt ou que vous écoutez.

Veo: Un nouvel outil qui crée des vidéos à partir d’invites, similaire à Sora d’OpenAI.

Imagen 3: la version la plus récente et de la plus haute qualité de l’outil de création de texte à partir d’images de Google.

Demandez à Photos: Une nouvelle fonctionnalité de Google Photos qui vous permet de rechercher et d’obtenir des informations sur vos photos en posant des questions.

Google Lens: Vous pouvez désormais poser des questions à l’aide de vidéos, et non plus seulement d’images.

Gemini sur Android: Bientôt, les utilisateurs d’Android pourront glisser-déposer des images générées par l’IA dans Gmail et d’autres applications. YouTube permettra également aux utilisateurs d’appuyer sur « Demander à cette vidéo » pour trouver des informations dans les vidéos.

OpenAI

Siri, Google Assistant et Alexa : attention ! OpenAI a présenté un véritable chatbot multimodal basé sur son nouveau modèle d’IA GPT-4o (« o » pour « omni »). Vous pouvez parler au robot, lui montrer des images ou des vidéos et obtenir des réponses vocales en temps réel.

En d’autres termes, il s’agit d’un véritable chatbot d’IA multimodal, qui ne se contente pas de convertir la voix et les images en texte et vice-versa. Vous pouvez lui poser des questions telles que « Quelle marque de chemise porte cette personne ? » et obtenir une réponse vocale.

Seul l’avenir nous dira si cette interface centrée sur la voix deviendra populaire. Pour l’instant, les invites textuelles permettant de générer des images d’IA sont moins populaires que les interfaces traditionnelles telles que les curseurs et les menus.

Sensaria

Présentation de OnePoint, une nouvelle API qui rationalise la gestion des commandes d’impression à la demande, en connectant plusieurs imprimeries Sensaria, Bay Photo et JONDO dans le monde entier.

(Anya Thrash, vice-présidente exécutive du marketing chez Bay Photo/Sensaria, partagera son point de vue à Visual 1st dans le cadre de notre groupe de discussion sur l’innovation dans les produits, la technologie et la fabrication des tirages photo).

Freepik & Magnific

Freepik a acquis Magnific, une société espagnole qui a développé une solution d’upscaler, d’amélioration et de transformation d’images alimentée par l’IA il y a seulement cinq mois. Il s’agit de la plus importante acquisition de Freepik à ce jour, qui s’ajoute à celles d’EyeEm, Videvo, Original Mockups et Iconfinder.

Claid

Claid, fournisseur d’API pour le commerce électronique visuel, a annoncé une mise à jour majeure. Elle comprend une nouvelle interface, une résolution plus élevée, des outils d’IA avancés pour créer des photos de produits de haute qualité et l’intégration de 15 outils d’image d’IA dans une API unique, permettant aux clients du commerce électronique d’automatiser l’ensemble de leurs flux de travail.

Pomme

Lors de son récent événement « Let Loose », Apple a présenté l’application Final Cut Camera, une puissante application de caméra vidéo offrant davantage de contrôle que l’application intégrée. Cette application pourrait rivaliser avec des applications tierces avancées telles que Blackmagic Camera ou Filmic Pro.

L’une des fonctions les plus remarquables est Live Multicam, qui permet aux utilisateurs de connecter plusieurs iPhones ou iPads pour filmer simultanément. Ces prises de vue sont automatiquement transférées et synchronisées avec Final Cut Pro, ce qui permet un montage transparent sous plusieurs angles. En bref, cette fonction transforme votre iPad en studio de production multicam.

Profoto

Profoto, lauréat des Visual 1st Best of Show Awards, a annoncé Eclipse II, la deuxième génération de sa station de photographie de produits. Elle comprend un équipement d’éclairage haut de gamme, un appareil photo Canon EOS R8 intégré, un logiciel de gestion du flux de travail et une interface contrôlée par iPad. Ce système est conçu pour capturer des photos et des vidéos de qualité professionnelle d’articles tels que des chaussures ou des accessoires, avec un minimum de compétences photographiques. Le nouveau système est plus lumineux, plus rapide et plus intelligent que l’original développé par StyleShoots, une société que Profoto a rachetée en 2022.

Méta

Les outils d’IA de Meta destinés aux annonceurs peuvent désormais créer de nouvelles images, et non plus seulement des arrière-plans. Par exemple, si vous avez une image de produit, telle qu’une tasse de café, vous pouvez remplacer l’arrière-plan et générer des variations du produit lui-même, par exemple en le montrant sous différents angles.

VSCO

VSCO présente VSCO Hub, une solution de recherche d’emploi permettant aux entreprises de trouver les bons photographes pour leurs projets. Cette nouvelle fonctionnalité comprend une aide à la recherche alimentée par l’IA pour faire correspondre les photographes à des exigences spécifiques.

OpenAI

OpenAI a lancé un détecteur de deepfake capable d’identifier les images d’IA de son modèle DALL-E avec une précision de 98,8 %. Cet outil fonctionne bien car OpenAI ajoute des métadonnées infalsifiables aux images DALL-E 3.

OpenAI

L’OpenAI étudie les moyens de permettre aux utilisateurs de générer du porno IA de manière responsable, en s’assurant que le contenu ne viole pas les lois ou les droits. Cette démarche reconnaît l’importance, pour certains utilisateurs, d’un contenu créatif impliquant la sexualité ou la nudité.

TikTok

TikTok va commencer à étiqueter le contenu généré par l’IA avec des « Content Credentials », ce qui en fait la première grande plateforme de médias sociaux à prendre en charge la norme ouverte C2PA. Ce label sera également ajouté au contenu en filigrane généré par l’IA en dehors de TikTok.

Les progrès rapides de la technologie de l’IA transforment radicalement l’industrie de la photo et de la vidéo. Grâce aux initiatives de Google, d’OpenAI, d’Apple et d’autres, les capacités de création et de gestion de contenu visuel deviennent plus sophistiquées et plus accessibles.