Demander une démo

Livre blanc

IA et Machine Learning pour la photographie : qu'offre-t-elle aux consommateurs ?

5 mars 2020  Aman Sharma

Commençons par positionner l'Intelligence Artificielle (IA), l'Apprentissage Machine, les Réseaux de Neurones Profonds… souvent, ces termes sont utilisés de manière interchangeable, mais en substance, ils sont comme des blocs de construction. L'IA est le terme générique désignant tout logiciel informatique qui fait quelque chose d'"intelligent", comme son nom l'indique. L'apprentissage automatique est un sous-ensemble de l'IA dans lequel vous définissez des critères de réussite qui permettent ensuite à la machine de créer et d'effectuer des tâches. Plus profond encore (jeu de mots !) Est Deep Neural Networks (ou apprentissage en profondeur), qui est un sous-ensemble de l'apprentissage automatique. Pour l'imagerie photographique, ces réseaux sont un ensemble d'algorithmes qui ont établi de nouveaux records de précision pour de nombreuses préoccupations telles que la reconnaissance, l'édition et le traitement d'images. En principe, l'IA signifie plusieurs choses et est généralement plus un moyen d'atteindre une fin qu'une fin en soi.

Figure 2 : Quels sont les principaux cas d'utilisation de l'IA dans votre entreprise ? (% des répondants)

Aujourd'hui, la technologie de l'IA fait des vagues dans de nombreux secteurs, notamment les biens de consommation et la vente au détail. Dans l'ensemble, la plupart des secteurs signalent que des cas d'utilisation de l'IA dans leur entreprise sont liés au service client et à l'assistance - en renforçant la connectivité et en devenant efficaces pour répondre aux besoins des clients.

En ce qui concerne la création de produits photo, il existe quelques domaines où l'IA est en effet un excellent outil pour créer de la valeur et améliorer l'expérience client et d'autres domaines où l'IA nécessite encore un financement important et des considérations de développement complexes. Voici quelques exemples de la valeur de l'IA dans notre domaine :

  • L'extraction de contexte et la reconnaissance de visage / contenu permettent d'identifier les personnes, de savoir ce qu'il y a sur la photo, comment les gens se sentent, de détecter les zones d'intérêt pour le recadrage automatique. Google Photo est un excellent exemple d'apprentissage automatique au travail
  • Qualité et pertinence des photos et amélioration automatique des images pour des suggestions automatiques après le téléchargement des photos. Des produits comme Perfectly Clear de EyeQ ou Adobe Lightroom en témoignent.
  • Le regroupement de photos liées permet une meilleure narration en évitant de mettre des photos de deux événements différents sur la même page ( important à noter : cela est généralement mieux servi et moins cher par date de prise et groupement delta, plutôt que par IA)
  • Géolocalisez les images en analysant le contenu des photos (c'est-à-dire les pixels, pas les métadonnées), même sans système GPS intégré, pour composer facilement des projets de voyage.
  • Des filtres comme "l'embellissement" automatique, les effets artistiques, etc. sont désormais proposés par la plupart des fabricants dans les logiciels d'appareil photo et de nombreuses applications
  • Chatbots et support automatisé pour fournir une aide basée sur des questions fréquentes.
  • Création automatique de projet telle que la mise en page automatique, bien que dans ce cas l'IA ne soit pas encore le candidat gagnant par rapport aux scripts codés existants ou à un concepteur humain, sauf dans les cas les plus simples où les algorithmes traditionnels peuvent souvent faire un travail raisonnable pour moins d'argent.

En résumé, actuellement en photographie, les performances de l'IA sont optimisées pour la création et l'édition d'images ; les algorithmes sont principalement conçus pour simplifier et améliorer la qualité de l'image et le processus d'édition, par image ou en groupe/catégorie. 

À l'heure actuelle, l'équipe de recherche et développement de Mediaclip étudie des approches crédibles et économiques pour sélectionner de grands ensembles d'images à partir de plusieurs appareils (téléphones, appareils photo) et environnements d'archivage (Google Photo, Facebook, ordinateur) et créer un contenu logique complexe, comme un livre photo. Nos enquêtes visent à découvrir comment l'IA peut créer une valeur réelle et mesurable pour les propriétaires d'entreprise et les consommateurs en améliorant le processus de sélection de photos et en fournissant un meilleur contexte pour la création automatisée de produits, tout en étant guidé par des décisions de conception et une variété d'experts. L'IA a toujours des coûts financiers et environnementaux importants, et les indicateurs les plus importants à suivre sont son impact sur les taux de conversion et la satisfaction des utilisateurs.

L'IA peut-elle interpréter la perception humaine pour les sélections de photos et les projets ?

Le logiciel de montage IA contient des ensembles d'instructions sur la qualité optimale d'une image, en termes de contenu, de reproduction, de densité, d'éclairage et même de recadrage. Ces instructions ont été assemblées sous un ensemble spécifique d'algorithmes ; ces notices s'appuient sur 150 ans d'expérience photographique et un suivi de qualité.

Par exemple, l'équipe Luminar AI indique qu'elle a collaboré avec les meilleurs photographes pour former leur logiciel de réseau neuronal, c'est donc presque comme si chaque image était analysée par cette équipe d'experts en photo. Cependant, le résultat final peut ne pas plaire à l'utilisateur et la décision finale d'accepter la correction doit être prise par image, car le logiciel peut mal interpréter le contenu de l'image et son impact souhaité dans le scénario. 

Sélectionner des photos et réaliser un projet personnalisé est le nom du jeu pour les détaillants et les consommateurs. En même temps, nous voulons assurer la meilleure expérience pour nos utilisateurs et nous assurer qu'ils ont le plus haut degré de contrôle, de transparence et d'efficacité tout en travaillant sur des projets plus complexes à fort engagement comme les livres photo. L'IA et l'apprentissage automatique devraient éventuellement aider le processus créatif, mais pas actuellement.

Pourquoi? Parce que l'insertion de ces algorithmes de haut niveau et complexes pour une meilleure sélection d'images, un contenu agréable et une narration précise nécessite une analyse informatique spéciale, plusieurs numérisations et la classification de chaque image dans un ensemble sélectionné. Ces efforts prennent du temps et nécessitent des ressources informatiques coûteuses à l'heure actuelle.

Un ensemble substantiel d'instructions diversifiées doit être intégré (time-line, métadonnées, reconnaissance faciale, bon jugement de comportement, décryptage entre images utiles et images inutiles), le tout devant être évalué à partir d'un large ensemble de données d'images consommateurs pour proposer un sélection d'image automatisée « en un clic » agréable et efficace. Actuellement, la plupart des sites de commerce électronique ne disposent pas de ces ressources. Nick Burns , un scientifique des données, soutient que, quelle que soit la qualité des modèles d'IA, ils sont simplement à égalité avec les données dont ils disposent.

Par conséquent, l'utilisation de l'IA et de l'apprentissage automatique pour effectuer une sélection de contenu d'image sur un petit et même un grand ensemble d'images qui transmettront l'émotion et l'histoire exactes prévues peut encore être assez difficile. Par exemple, dans une série de portraits, la reconnaissance faciale est importante sans aucun doute. Mais le sujet clignote-t-il ou clignote-t-il ? Le sujet est-il bien positionné ? Ou est-ce que tout le monde sourit sur une photo de groupe ? Si non, quelle image est la meilleure à sélectionner ? Dans d'autres circonstances, certains critères définis qui fournissent la "connaissance" à l'IA peuvent ne pas être optimaux pour la mémoire réelle. Par exemple, une photo avec un faible éclairage peut véhiculer le bon sentiment et ne doit pas être rejetée ou corrigée automatiquement, ou certaines "imperfections" sur le sujet lui donnent son caractère/individualité et ne doivent pas être adoucies. En raison de telles nuances, les sélections proposées et les corrections d'image doivent encore être confirmées par l'utilisateur.

Dans le cadre de nos efforts de recherche et développement, nous expérimentons les possibilités d'intégration de ces algorithmes sophistiqués d'un point de vue économique et technologique. Notre processus pour obtenir une sélection optimale d'images en un clic est régulièrement revu pour s'assurer qu'il offre le meilleur scénario possible pour nos clients, leurs consommateurs et l'ensemble du processus. Actuellement, notre objectif est d'améliorer les algorithmes qui simplifient et optimisent le contenu des mises en page complexes. Selon notre analyse, cela se traduit par un retour sur investissement plus élevé pour l'entreprise et une expérience utilisateur final plus intuitive.

En résumé, AI Deep Neural Networks nécessiterait des années d'analyse de données sur les perceptions d'images ou de souvenirs de l'utilisateur, en plus de son intention et de son comportement, pour être suffisamment efficace pour des suggestions d'images et de projets complexes en un clic . Les couches et la profondeur d'un esprit humain lors de la prise de décisions (entre autres) sont incontestablement plus sophistiquées que l'IA et il est peu probable qu'elles soient reproduites facilement dans un proche avenir.

L'intelligence artificielle par rapport au développement de logiciels traditionnels pour réaliser des projets photo automatisés en un clic (comme des livres photo) en 2021

Comme nous en avons discuté précédemment, l'IA et l'apprentissage automatique font un excellent travail pour aider à gérer et à améliorer les images (c'est-à-dire les corrections automatiques, le regroupement de sujets, la reconnaissance faciale/d'objet, etc.) Les fonctionnalités offertes par les logiciels soutenus par l'IA s'améliorent et peuvent s'attaquer à plus de problèmes à une vitesse stupéfiante. De nombreuses solutions de personnalisation de produits l'utilisent pour enrichir l'expérience utilisateur. Dans les situations où les images sont déjà disponibles pour analyse, comme dans les solutions d'archivage comme Google Photo ou les applications mobiles où les photos sont déjà sur un seul appareil, l'IA offre une valeur extraordinaire en cataloguant les collections d'images des utilisateurs de manière significative et utile. Dans certains cas, ils peuvent même utiliser ce catalogage pour proposer des produits avec des options de conception limitées.

L'option de conception limitée est le problème central ici. L'IA est un excellent outil pour extraire un sous-ensemble significatif d'images d'une plus grande collection et peut aider à deviner une séquence lorsqu'il existe un contexte commun tel qu'un mariage ou une séance photo. Cependant, l'IA n'est pas utilisée pour créer un design de qualité ou pour tirer le meilleur parti des images. 

Pourquoi ne devrions-nous pas également utiliser l'IA pour la conception de produits ?

Pour répondre à cette question, comparons l'intelligence artificielle au développement logiciel "normal" par des développeurs expérimentés. Les deux approches fournissent un cadre d'outils pour permettre potentiellement la conception de bâtiments, mais aucune ne sait rien de la conception. L'intelligence artificielle, plus précisément l'apprentissage automatique, peut comprendre comment faire quelque chose en se basant sur de grands ensembles de données et des critères de réussite. Construire des données significatives et peaufiner ce qui est considéré comme une « conception réussie » est extrêmement coûteux et prend du temps. Là où l'IA brille, c'est dans les scénarios où il n'est pas trivial de codifier ce qui constitue une bonne mise en œuvre. Dans le cas de la conception d'un livre cependant, nous pouvons codifier ce qui constitue de bonnes décisions de conception. Des marges sûres et normalisées, ainsi que des règles de mise en page axées sur l'esthétique et le contenu peuvent être fournies par des experts en conception et mises en œuvre pour une fraction du coût, tout en offrant une variété. Bien sûr, le thème noir avec une photo par page fonctionne, mais continuer à fournir un contenu nouveau, intéressant et pertinent aux utilisateurs est toujours beaucoup plus rentable avec les outils traditionnels.

Mais au final, nous n'avons pas à choisir entre l'intelligence artificielle et le développement de logiciels traditionnels. Les deux peuvent être utilisés pour créer d'excellentes solutions. Par exemple, nous pouvons utiliser les forces de l'intelligence artificielle d'aujourd'hui pour alimenter les algorithmes traditionnels avec des informations significatives, comme si une photo a une pertinence plus élevée qu'une autre, sans nécessairement qu'elle détermine cette photo devrait être sur une page.

L'utilisation de l'intelligence artificielle à son plein potentiel aujourd'hui est actuellement limitée par son coût total de possession. C'est un défi de connecter économiquement tous les éléments de base nécessaires pour tirer le meilleur parti de toutes ces données. Les coûts de licence, les exigences informatiques, les performances médiocres et la baisse des revenus nets sont les principaux obstacles à une adoption à grande échelle.

Une question terre à terre que nous devrions nous poser en tant qu'industrie est de savoir si toutes ces fonctionnalités apportées par l'intelligence artificielle sont réellement nécessaires ? En théorie, avoir des photos regroupées par couleurs, rejeter des images en fonction de la qualité et utiliser des métadonnées avancées pour prendre des décisions de conception sont formidables et permettent des présentations étonnantes, mais entraîneront-elles réellement la vente ? Qu'est-ce qui excitera le client et comprendra-t-il même ce qui se passe ? Devrions-nous éduquer les utilisateurs finaux sur ce que l'IA peut leur apporter, ou devrions-nous simplement leur simplifier les choses ?

Nous devons encore plaider en faveur de fonctionnalités d'intelligence artificielle individuelles, afin qu'investir dans celles-ci à ce stade puisse générer des revenus et améliorer l'expérience utilisateur aujourd'hui. À la vitesse à laquelle les innovations en matière d'intelligence artificielle se produisent, nous pouvons nous attendre à ce que les possibilités «financièrement viables» continuent de croître. Nous pouvons également nous attendre à plus de données sur ce qui fonctionne et ce qui ne fonctionne pas afin que les investissements puissent être justifiés.

Explorons également pourquoi l'esthétique du projet proposé par l'IA est importante et constitue un obstacle majeur à une adoption généralisée. Imaginez qu'un système d'IA actuel doive créer un livre photo à partir de vos photos. Le laisseriez-vous choisir quelles photos le feront (ou pas) sans les regarder également ? Lui feriez-vous confiance pour deviner s'il s'agit d'un cadeau, d'une cérémonie de mariage ou d'un simple souvenir de famille ? Accepteriez-vous uniquement des pages noires et des images centrées ? Souhaitez-vous choisir le prix que vous souhaitez payer pour ce produit et le niveau de qualité du papier, de la reliure, etc. ? Et, peut-être le plus important, pensez-vous que ces réponses pourraient être les mêmes pour tout le monde ?

La création de produits entièrement automatisée nécessite des algorithmes de discrimination prédéterminés, qui peuvent être basés sur «ce qui fonctionne habituellement» ou sur des entrées soigneusement sélectionnées de l'utilisateur. Alors, l'IA peut-elle réellement choisir une séquence esthétique logique sans quelques instructions contextuelles du consommateur ? Eh bien, oui, tant que vous êtes d'accord avec un livre générique. Et même dans ce cas, créer un livre générique avec le développement de logiciels traditionnels sera beaucoup moins cher et plus facile à améliorer à mesure que vous en apprendrez davantage sur votre marché spécifique.

L'IA peut aider à gérer de grands ensembles de données et à prendre des décisions automatisées, comme trier des images et comprendre ce qu'il y a dans une image, mais encore une fois, à un coût élevé et avec des retards supplémentaires du point de vue de l'utilisateur en raison de la charge de travail informatique requise, en particulier dans le contexte d'une boutique e-commerce. L'analyse d'un grand nombre de photos téléchargées pour les regrouper, les catégoriser et les mettre dans une séquence agréable sur des sites Web peut facilement ajouter quelques dollars par livre créé, qu'il ait été commandé ou non. Les revenus supplémentaires valent-ils le risque financier ? Considérer ce qui suit:

  1. Lorsque les acheteurs entrent sur un site et téléchargent de grandes quantités de photos pour leurs projets, mais qu'en moyenne 20 % finissent par ne pas acheter, l'entreprise engagera des coûts informatiques qui ne seront pas tous compensés par les ventes.
  2. L'analyse de charges volumineuses de photos peut prendre plusieurs minutes. Les consommateurs perçoivent ce « crunch » comme un décalage de production important. Les consommateurs d'aujourd'hui axés sur la vitesse n'acceptent pas les retards, même lorsqu'ils sont justifiés par une analyse complexe, et ces retards affectent les taux de conversion.
  3. Le coût d'ingénierie de l'enchaînement et de l'initiation de ces blocs de construction d'IA pour créer des mises en page suggérées automatiquement est très coûteux. Étant donné que les ressources nécessaires changent constamment, les connaissances, la technologie et les exigences futures en matière d'ingénierie sont rares et coûteuses.

Alors que Mediaclip évalue constamment l'IA et d'autres technologies progressives, nous avons trouvé qu'il est plus flexible et plus rentable d'écrire des algorithmes qui effectuent des tâches intelligentes comme regrouper des photos, générer des thèmes de produits agréables, optimiser des scénarios de mise en page de livres et placer de manière intéressante une ou plusieurs images tout en respectant leur ratio de contenu d'image sur chaque page / surface individuelle, le tout à un prix raisonnable et avec le soutien d'un design expert, tout en conservant la variété qu'attendent les consommateurs.

Pourquoi Mediaclip ne sautera pas dans le "train hype" de l'IA... pour le moment

L'équipe R&D de Mediaclip expérimente en permanence différentes options pour réaliser des livres photo riches qui racontent une histoire en permettant aux utilisateurs de s'exprimer tout en équilibrant le temps nécessaire à leur création. Nous voyons aujourd'hui de nombreuses techniques qui nous aideront à utiliser l'IA de nombreuses manières très utiles, mais nous n'avons pas trouvé de solution qui puisse remplacer des conceptions et des algorithmes soigneusement élaborés de manière rentable .

Il y a des choses spécifiques que nous devons encore voir avant de recommander l'IA comme moteur de base pour la personnalisation des produits :

Créer des conceptions et des mises en page convaincantes - Notre système de conception intelligent permet déjà des conceptions riches et intéressantes qui répondent à toutes sortes d'événements de la vie et de styles de produits. Les utilisateurs peuvent facilement réorganiser et recomposer leurs pages en fonction des meilleures mises en page possibles pour leurs besoins. Les services d'intelligence d'image existants peuvent aider à améliorer automatiquement les images ou à recadrer automatiquement les images lorsque la conception l'exige, par exemple lors de l'utilisation de contenu sous licence. Tout cela est actuellement disponible sans utiliser d'outils basés sur l'IA.

Rentabilité - Il existe actuellement deux méthodes pour fournir un service basé sur l'IA ; l'IA cliente (généralement disponible sur les appareils mobiles pour analyser la bibliothèque d'images d'un utilisateur) et l'IA basée sur le serveur. Il existe d'excellentes solutions pour fournir des recommandations de produits sur un appareil mobile. cependant, les deux méthodes peuvent être beaucoup plus chères que leurs homologues non IA. Remarque : nous pensons que (spécifiquement) pour les capacités de découverte et de conservation de photos des applications mobiles, l'IA offre des options très solides à considérer aujourd'hui.

Contrôle du résultat. L'IA, plus précisément l'apprentissage automatique, est excellente pour deviner une méthode qui reproduira ce que vous lui donnez. Cependant, cela réduit également considérablement votre capacité à modifier et à adapter l'algorithme à vos besoins. Si vous pensez qu'une image doit être traitée légèrement différemment, ou si votre équipe de conception souhaite prendre une décision de conception spécifique basée sur une orientation d'image, elle sera sévèrement limitée.

Nous avons pu créer des démos impressionnantes en utilisant des solutions existantes et des idées de prototypage à l'aide de logiciels propriétaires et open source. Cependant, nos efforts de développement se concentrent sur les taux de conversion, la satisfaction des utilisateurs et l'augmentation des revenus de nos clients et partenaires, et non sur la création de vitrines "cool". Nous ne sommes pas satisfaits des solutions actuelles et ne pouvons pas recommander de sauter sur le vaisseau AI pour l'instant. Nous croyons cependant que c'est un domaine qui vaut notre temps et notre investissement car les coûts associés diminuent et les offres s'améliorent.

En conclusion, nous pensons que l'IA est un outil extraordinaire, bien que coûteux, pour aider à la conservation de photos sur les appareils mobiles et sur les sites d'hébergement de photos. Il peut également fournir des informations utiles sur le contenu des utilisateurs et vous aider à déterminer la manière dont vous présentez et communiquez avec les utilisateurs sur votre site. Cependant, ces informations et avantages ont un coût qui n'en fait pas encore une décision « imprudente ». Gardez à l'esprit que l'intelligence artificielle n'est pas une fonctionnalité ; il ne fait rien tout seul. C'est une méthode qui peut résoudre efficacement des catégories spécifiques de problèmes . Rappelez-vous le dicton, "quand vous avez un marteau, tout ressemble à un clou?" Eh bien, dans cette conversation, l'IA est un marteau de démolition ; c'est un outil extrêmement utile à avoir dans votre remise, mais cela ne vous aidera pas à décorer .

Les limites des solutions d'IA actuelles ne sont pas négligeables. Sacrifier le choix et le style en faveur de l'intelligence de mise en page, alors que cette intelligence est déjà disponible à une fraction du coût avec le codage traditionnel, fait de l'IA une option moins convaincante pour le moment. Bien sûr, il peut y avoir des adopteurs précoces de technologies qui ne sont pas découragés par certains niveaux de risque commercial lorsqu'ils utilisent des solutions basées sur l'IA pour l'intelligence de mise en page. Nous aussi croyons en l'IA et ce n'est qu'une question de temps avant que nous découvrions un moyen rentable d'utiliser ses capacités d'une manière qui profite à la fois à nos clients et à leurs acheteurs.

Maintenant, ne vous méprenez pas, nous sommes ravis de la myriade de possibilités de l'intelligence artificielle. Nous sommes étonnés par les nouveaux développements constants et ne pouvons qu'envisager des opportunités positives à l'avenir. Il serait toutefois irresponsable de recommander l'utilisation de solutions basées sur l'IA à l'heure actuelle, car elles ne sont pas encore des options économiquement viables à utiliser pour des projets à grande échelle par rapport aux approches traditionnelles qui donnent les mêmes résultats. Nous sommes impatients de découvrir davantage de recherches et d'expériences basées sur les données sur des fonctionnalités spécifiques basées sur l'IA que nos clients peuvent appliquer à leur propre secteur d'activité et à leurs utilisateurs. Nous continuerons à travailler sur l'évaluation des solutions et à étudier l'effet sur des mesures importantes telles que les taux de conversion et la satisfaction des utilisateurs.

Par tous les moyens, vous avez le choix de décider si l'IA répond aux besoins de votre entreprise et/ou aux demandes de vos acheteurs malgré son coût élevé actuel. Cependant, s'il vous plaît, sortez du battage marketing - la diligence raisonnable est aussi cruciale ici que dans toute autre entreprise commerciale.