Livre blanc
Tout d’abord, positionnons l’intelligence artificielle (IA), l’apprentissage automatique, les réseaux neuronaux profonds… Ces termes sont souvent utilisés de manière interchangeable, mais ils sont en fait comme des éléments constitutifs. L’IA est le terme générique qui désigne tout logiciel informatique qui, comme son nom l’indique, fait quelque chose d' »intelligent ». L’apprentissage automatique est un sous-ensemble de l’IA dans lequel vous définissez des critères de réussite qui permettent ensuite à la machine de créer et d’accomplir des tâches. Les réseaux neuronaux profonds (ou apprentissage profond), qui constituent un sous-ensemble de l’apprentissage automatique, sont encore plus profonds (le jeu de mots n’est pas de mise !). Pour l’imagerie photographique, ces réseaux constituent un ensemble d’algorithmes qui ont établi de nouveaux records de précision dans de nombreux domaines tels que la reconnaissance, l’édition et le traitement d’images. En principe, l’IA a de multiples significations et est généralement plus un moyen qu’une fin en soi.

Aujourd’hui, la technologie de l’IA fait parler d’elle dans de nombreux secteurs, y compris les biens de consommation et le commerce de détail. Dans l’ensemble, la plupart des secteurs indiquent que les cas d’utilisation de l’IA dans leur entreprise sont liés au service et à l’assistance à la clientèle – en renforçant la connectivité et en devenant efficace dans la réponse aux besoins des clients.
En ce qui concerne la création de produits photo, il y a quelques domaines où l’IA est en effet un excellent outil pour créer de la valeur et améliorer l’expérience du client, et d’autres domaines où l’IA nécessite encore un financement important et des considérations de développement complexes. Voici quelques exemples de la valeur de l’IA dans notre domaine :
- L’extraction de contexte et la reconnaissance des visages et du contenu permettent d’identifier les personnes, de savoir ce qu’il y a dans la photo, ce que ressentent les gens, de détecter les zones d’intérêt pour le recadrage automatique. Google Photo est un excellent exemple de l’apprentissage automatique à l’œuvre.
- Qualité et pertinence des photos et amélioration automatique de l’image pour des suggestions automatiques après le téléchargement des photos. Des produits comme Perfectly Clear by EyeQ ou Adobe Lightroom en sont le reflet.
- Le regroupement de photos apparentées permet de mieux raconter l’histoire en évitant de mettre sur la même page des photos de deux événements différents(Remarque importante: il est généralement plus efficace et moins coûteux de regrouper les photos par date de prise de vue et par delta, plutôt que par IA).
- Géolocaliser les images en analysant le contenu des photos (c’est-à-dire les pixels, pas les métadonnées), même sans système GPS intégré, pour composer facilement des projets de voyage.
- Des filtres tels que l' »embellissement » automatique, les effets artistiques, etc. sont désormais proposés par la plupart des fabricants dans le logiciel de l’appareil photo et dans de nombreuses applications.
- Chat bots et support automatisé pour fournir de l’aide en fonction des questions fréquentes.
- La création automatique de projets, comme la mise en page automatique, bien que dans ce cas l’IA ne soit pas encore le candidat gagnant par rapport aux scripts codés existants ou à un concepteur humain, sauf dans les cas les plus simples où les algorithmes traditionnels peuvent souvent faire un travail raisonnable pour moins d’argent.
En résumé, dans le domaine de la photographie, les performances de l’IA sont actuellement optimisées pour la création et l’édition d’images ; les algorithmes sont principalement conçus pour simplifier et améliorer la qualité de l’image et le processus d’édition, par image ou par groupe/catégorie.
Actuellement, l’équipe de recherche et développement de Mediaclip étudie des approches crédibles et économiques pour sélectionner de grands ensembles d’images à partir de multiples appareils (téléphones, caméras) et environnements d’archivage (Google Photo, Facebook, ordinateur) et créer un contenu logique complexe, comme un livre de photos. Nos recherches visent à découvrir comment l’IA peut créer une valeur réelle et mesurable pour les propriétaires d’entreprises et les consommateurs en améliorant le processus de sélection des photos et en fournissant un meilleur contexte pour la création automatisée de produits, tout en restant guidée par des décisions de conception et une variété d’experts. L’IA a encore des coûts financiers et environnementaux importants, et les indicateurs les plus importants à suivre sont la façon dont elle affecte les taux de conversion et la satisfaction des utilisateurs.
L’IA peut-elle interpréter la perception humaine pour les sélections de photos et les projets ?
Le logiciel d’édition AI contient des ensembles d’instructions sur la qualité optimale d’une image, en termes de contenu, de reproduction, de densité, d’éclairage et même de recadrage. Ces instructions ont été assemblées selon un ensemble spécifique d’algorithmes ; elles s’appuient sur 150 ans d’expérience photographique et de contrôle de la qualité.
Par exemple, l’équipe Luminar AI indique qu’elle a collaboré avec des photographes de renom pour entraîner le réseau neuronal de son logiciel, de sorte que c’est presque comme si chaque image était analysée par cette équipe d’experts en photographie. Toutefois, le résultat final peut ne pas plaire à l’utilisateur et la décision finale d’accepter la correction doit être prise pour chaque image, car le logiciel peut mal interpréter le contenu de l’image et son impact souhaité dans l’intrigue.
La sélection des photos et la réalisation d’un projet personnalisé sont au cœur des préoccupations des détaillants et des consommateurs. Dans le même temps, nous voulons garantir la meilleure expérience possible à nos utilisateurs et nous assurer qu’ils disposent du plus haut degré de contrôle, de transparence et d’efficacité lorsqu’ils travaillent sur des projets plus compliqués et à fort engagement, comme les livres photo. L’IA et l’apprentissage automatique devraient un jour aider le processus créatif, mais pas actuellement.
Pourquoi ? Parce que l’insertion de ces algorithmes complexes de haut niveau pour une meilleure sélection d’images, un contenu agréable et une narration précise nécessite une analyse informatique spéciale, des numérisations multiples et la classification de chaque image dans un ensemble sélectionné. Ces efforts prennent du temps et nécessitent des ressources informatiques coûteuses à l’heure actuelle.
Un ensemble substantiel d’instructions diversifiées doit être intégré (chronologie, métadonnées, reconnaissance des visages, jugement de bon comportement, déchiffrage entre les images utiles et inutiles), qui doivent toutes être évaluées à partir d’un vaste ensemble de données d’images de consommateurs afin de proposer une sélection automatisée d’images agréable et efficace « en un seul clic ». Actuellement, la plupart des sites de commerce électronique ne disposent pas de ces ressources. Nick Burns, un scientifique spécialisé dans les données, affirme que les modèles d’IA, aussi performants soient-ils, ne sont qu’à la hauteur des données dont ils disposent.
Par conséquent, l’utilisation de l’IA et de l’apprentissage automatique pour sélectionner le contenu d’une petite, voire d’une grande série d’images qui transmettront exactement l’émotion et l’histoire voulues peut encore s’avérer très difficile. Par exemple, dans une série de portraits, la reconnaissance des visages est incontestablement importante. Mais le sujet fait-il un clin d’œil ou cligne-t-il des yeux ? Est-il bien posé ? Ou encore, tout le monde sourit-il sur une photo de groupe ? Si ce n’est pas le cas, quelle est la meilleure image à sélectionner ? Dans d’autres circonstances, certains critères définis qui fournissent la « connaissance » à l’IA peuvent ne pas être optimaux pour la mémoire réelle. Par exemple, une photo à faible luminosité peut être porteuse d’un bon sentiment et ne doit pas être rejetée ou corrigée automatiquement, ou certaines « imperfections » du sujet lui confèrent son caractère/individualité et ne doivent pas être adoucies. En raison de ces nuances, les sélections proposées et les corrections d’image doivent encore être confirmées par l’utilisateur.
Dans le cadre de nos efforts de recherche et de développement, nous expérimentons les possibilités d’intégration de ces algorithmes sophistiqués d’un point de vue économique et technologique. Notre processus de sélection optimale des images en un seul clic est régulièrement réexaminé pour s’assurer qu’il offre le meilleur scénario possible pour nos clients, leurs consommateurs et l’ensemble du processus. Actuellement, nous nous concentrons sur l’amélioration des algorithmes qui simplifient et optimisent le contenu des mises en page complexes. Selon notre analyse, cela se traduit par un meilleur retour sur investissement pour l’entreprise et une expérience plus intuitive pour l’utilisateur final.
En résumé, les réseaux neuronaux profonds de l’IA nécessiteraient des années d’analyse de données sur les perceptions d’ images ou de souvenirs de l’utilisateur, en plus de son intention et de son comportement, pour être suffisamment efficaces pour des suggestions d’images et de projets complexes en un seul clic. Les couches et la profondeur de l’esprit humain lorsqu’il prend des décisions (entre autres) sont incontestablement plus sophistiquées que l’IA et il est peu probable qu’elles puissent être reproduites facilement dans un avenir proche.
L’intelligence artificielle par rapport au développement de logiciels traditionnels pour réaliser des projets photo automatisés en un seul clic (comme les livres photo) en 2021
Comme nous l’avons évoqué précédemment, l’IA et l’apprentissage automatique font un excellent travail pour aider à gérer et à améliorer les images (c’est-à-dire les corrections automatiques, le regroupement des sujets, la reconnaissance des visages et des objets, etc.) Les fonctionnalités offertes par les logiciels soutenus par l’IA s’améliorent et peuvent s’attaquer à davantage de problèmes à une vitesse stupéfiante. De nombreuses solutions de personnalisation de produits l’utilisent pour enrichir l’expérience des utilisateurs. Dans les situations où les images sont déjà disponibles pour analyse, comme dans les solutions d’archivage telles que Google Photo ou les applications mobiles où les photos se trouvent déjà sur un seul appareil, l’IA apporte une valeur extraordinaire en cataloguant les collections d’images de l’utilisateur de manière significative et utile. Dans certains cas, elle peut même utiliser ce catalogage pour proposer des produits dont les options de conception sont limitées.
L’option de conception limitée est le principal problème ici. L’IA est un excellent outil pour extraire un sous-ensemble significatif d’images d’une collection plus vaste, et peut aider à deviner une séquence lorsqu’il existe un contexte commun tel qu’un mariage ou une séance photo. Cependant, l’IA n’est pas utilisée pour créer un design de qualité ou pour exploiter au mieux les images.
Pourquoi ne pas utiliser l’IA pour la conception de produits ?
Pour répondre à cette question, comparons l’intelligence artificielle au développement « normal » de logiciels par des développeurs expérimentés. Les deux approches fournissent un cadre d’outils permettant potentiellement de construire des conceptions, mais aucune ne sait quoi que ce soit sur la conception. L’intelligence artificielle, et plus précisément l’apprentissage automatique, peut déterminer comment faire quelque chose sur la base de vastes ensembles de données et de critères de réussite. L’élaboration de données significatives et l’ajustement de ce qui est considéré comme une « conception réussie » sont extrêmement coûteux et prennent beaucoup de temps. L’IA est particulièrement utile dans les scénarios où il n’est pas facile de codifier ce qui constitue une bonne mise en œuvre. Dans le cas de la conception d’un livre, cependant, nous pouvons codifier ce qui constitue de bonnes décisions en matière de conception. Des marges sûres et normalisées, ainsi que des règles de mise en page axées sur l’esthétique et le contenu peuvent être fournies par des experts en conception et mises en œuvre pour une fraction du coût, tout en offrant de la variété. Bien sûr, le thème noir avec une photo par page fonctionne, mais il est beaucoup plus rentable d’utiliser des outils traditionnels pour fournir aux utilisateurs un contenu nouveau, intéressant et pertinent.
Mais en fin de compte, nous n’avons pas à choisir entre l’intelligence artificielle et le développement traditionnel de logiciels. Les deux peuvent être utilisés pour élaborer de bonnes solutions. Par exemple, nous pouvons utiliser les atouts actuels de l’intelligence artificielle pour fournir aux algorithmes traditionnels des informations significatives, telles que la pertinence d’une photo par rapport à une autre, sans nécessairement leur demander de déterminer l’emplacement de cette photo sur une page.
L’utilisation de l’intelligence artificielle à son plein potentiel est actuellement limitée par son coût total de possession. Il est difficile de connecter économiquement tous les éléments nécessaires pour tirer le meilleur parti de toutes ces données. Les coûts de licence, les exigences informatiques, la baisse des performances et la diminution des revenus sont les principaux obstacles à l’adoption à grande échelle.
Une question terre-à-terre que nous devrions nous poser en tant qu’industrie est de savoir si toutes ces fonctionnalités apportées par l’intelligence artificielle sont réellement nécessaires. En théorie, regrouper les photos par couleur, écarter les images en fonction de leur qualité et utiliser des métadonnées avancées pour prendre des décisions en matière de conception, c’est formidable et cela permet de faire des présentations étonnantes, mais est-ce que cela conduira réellement à la vente? Qu’est-ce qui enthousiasmera le client, et comprendra-t-il même ce qui se passe ? Devrions-nous éduquer les utilisateurs finaux sur ce que l’IA peut leur apporter, ou devrions-nous simplement leur simplifier les choses ?
Nous devons encore justifier les différentes caractéristiques de l’intelligence artificielle, de sorte qu’investir dans celles-ci à ce stade puisse générer des revenus et améliorer l’expérience de l’utilisateur aujourd’hui. À la vitesse à laquelle les innovations en matière d’intelligence artificielle se produisent, nous pouvons nous attendre à ce que les possibilités « financièrement viables » continuent de s’accroître. Nous pouvons également nous attendre à ce qu’il y ait davantage de données sur ce qui fonctionne et ce qui ne fonctionne pas, de sorte que les investissements puissent être justifiés.
Voyons également pourquoi l’esthétique des projets proposés par l’IA est importante et constitue un obstacle majeur à leur adoption à grande échelle. Imaginez qu’un système d’IA actuel doive créer un livre photo à partir de vos photos. Le laisseriez-vous choisir les photos qui y figureront (ou non) sans les regarder ? Lui feriez-vous confiance pour deviner s’il s’agit d’un cadeau, d’une cérémonie de mariage ou d’un simple souvenir de famille ? Vous contenteriez-vous de pages noires et d’images centrées ? Aimeriez-vous choisir le prix que vous voulez payer pour ce produit et le niveau de qualité du papier, de la reliure, etc. Et, ce qui est peut-être le plus important, croyez-vous que ces réponses puissent être les mêmes pour tout le monde?
La construction entièrement automatisée de produits nécessite des algorithmes de discrimination prédéterminés, qui peuvent être basés soit sur « ce qui fonctionne habituellement », soit sur des données soigneusement sélectionnées par l’utilisateur. L’IA peut-elle donc choisir une séquence esthétique logique sans instructions contextuelles de la part du consommateur ? Eh bien, oui, tant que l’on peut se contenter d’un livre générique. Et même dans ce cas, la réalisation d’un livre générique par le biais d’un développement logiciel traditionnel sera beaucoup moins coûteuse et plus facile à améliorer au fur et à mesure que vous apprendrez à connaître votre marché spécifique.
L’IA peut aider à gérer de grands ensembles de données et à prendre des décisions automatisées, comme trier les images et comprendre ce qu’elles contiennent, mais là encore, à un coût élevé et avec des retards supplémentaires du point de vue de l’utilisateur en raison de la charge de travail informatique requise, en particulier dans le contexte d’un magasin de commerce électronique. L’analyse d’un grand nombre de photos téléchargées pour les regrouper, les classer et les présenter dans une séquence agréable sur les sites web peut facilement ajouter quelques dollars par livre créé, qu’il ait été commandé ou non. Les recettes supplémentaires valent-elles le risque financier ? Considérez ce qui suit :
- Lorsque des acheteurs entrent sur un site et téléchargent de grandes quantités d’images pour leurs projets, mais qu’en moyenne 20 % d’entre eux n’achètent pas, l’entreprise encourt des coûts informatiques qui ne sont pas tous compensés par les ventes.
- L’analyse de charges volumineuses de photos peut prendre plusieurs minutes. Les consommateurs perçoivent ce « crunch » comme un retard important dans la production. Or, les consommateurs d’aujourd’hui, qui sont pressés par le temps, n’acceptent pas les retards, même lorsqu’ils sont justifiés par une analyse complexe, et ces retards ont une incidence sur les taux de conversion.
- Le coût d’ingénierie de l’enchaînement et de l’activation de ces blocs de construction de l’IA pour créer des schémas auto-suggérés est très élevé. Les ressources nécessaires étant en constante évolution, les connaissances, la technologie et les exigences futures en matière d’ingénierie sont rares et coûteuses.
Bien que Mediaclip évalue constamment l’IA et d’autres technologies progressives, nous avons constaté qu’il est plus souple et plus rentable d’écrire des algorithmes qui effectuent des tâches intelligentes telles que le regroupement de photos, la création de thèmes de produits agréables, l’optimisation de scénarios de mise en page de livres et le placement intéressant d’une ou de plusieurs images tout en respectant leur ratio de contenu d’image sur chaque page/surface individuelle, le tout à un prix raisonnable et avec le soutien d’une conception experte, tout en conservant la variété attendue par les consommateurs.
Pourquoi Mediaclip ne sautera pas dans le train de l’IA… pour l’instant
L’équipe R&D de Mediaclip expérimente en permanence différentes options pour réaliser des livres photo riches qui racontent une histoire en permettant aux utilisateurs de s’exprimer tout en équilibrant le temps nécessaire à leur création. Nous voyons aujourd’hui de nombreuses techniques qui nous aideront à utiliser l’IA de nombreuses manières très utiles, mais nous n’avons pas trouvé de solution qui puisse remplacer des conceptions et des algorithmes soigneusement élaborés d’une manière rentable.
Il y a des choses spécifiques que nous devons encore voir avant de recommander l’IA comme moteur principal de la personnalisation des produits :
Création de conceptions et de mises en page attrayantes – Notre système de conception intelligent permet déjà de créer des conceptions riches et intéressantes qui répondent à toutes sortes d’événements de la vie et de styles de produits. Les utilisateurs peuvent facilement réorganiser et recomposer leurs pages en fonction des meilleures mises en page possibles pour leurs besoins. Les services existants d’intelligence de l’image peuvent aider à améliorer automatiquement les images ou à les recadrer automatiquement lorsque la conception l’exige, par exemple en cas d’utilisation de contenu sous licence. Tout cela est actuellement possible sans utiliser d’outils basés sur l’intelligence artificielle.
Rentabilité – Il existe actuellement deux méthodes pour fournir des services basés sur l’IA : l’IA client (généralement disponible sur les appareils mobiles pour scanner la bibliothèque d’images d’un utilisateur) et l’IA serveur. Il existe d’excellentes solutions pour fournir des recommandations de produits sur un appareil mobile ; cependant, les deux méthodes peuvent être beaucoup plus coûteuses que leurs équivalents non basés sur l’IA. Remarque : nous pensons que (spécifiquement) pour les capacités de « découverte de photos » et de curation des applications mobiles, l’IA offre aujourd’hui de très bonnes options à prendre en considération.
Contrôle du résultat. L’IA, et plus particulièrement l’apprentissage automatique, est excellente pour deviner une méthode qui reproduira ce que vous lui donnez. Cependant, cela réduit considérablement votre capacité à peaufiner et à adapter l’algorithme à vos besoins. Si vous estimez qu’une image doit être traitée légèrement différemment, ou si votre équipe de conception souhaite prendre une décision spécifique en fonction de l’orientation de l’image, elle sera fortement limitée.
Nous avons pu créer des démonstrations impressionnantes en utilisant des solutions existantes et des idées de prototypage à l’aide de logiciels propriétaires et open-source. Cependant, nos efforts de développement se concentrent sur les taux de conversion, la satisfaction des utilisateurs et l’augmentation des revenus pour nos clients et partenaires, et non sur la création de démonstrations « cool ». Nous ne sommes pas satisfaits des solutions actuelles et nous ne pouvons pas recommander de sauter dans le bateau de l’IA tout de suite. Nous pensons cependant que c’est un domaine qui mérite notre temps et nos investissements, car les coûts associés diminuent et les offres s’améliorent.
En conclusion, nous pensons que l’IA est un outil extraordinaire, bien que coûteux, pour faciliter la curation de photos sur les appareils mobiles et sur les sites d’hébergement de photos. Elle peut également fournir des informations utiles sur le contenu des utilisateurs et vous aider à définir la manière dont vous présentez et communiquez avec les utilisateurs sur votre site. Toutefois, ces informations et ces avantages ont un coût qui n’en fait pas encore une décision évidente. Gardez à l’esprit que l’intelligence artificielle n’est pas une fonctionnalité ; elle ne fait rien en soi. Il s’agit d’une méthode qui permet de résoudre efficacement des catégories spécifiques de problèmes. Vous vous souvenez du dicton « quand on a un marteau, tout ressemble à un clou » ? Dans cette conversation, l’IA est un marteau de démolition; c’est un outil extrêmement utile à avoir dans sa remise, mais il ne vous aidera pas à décorer.
Les limites des solutions d’IA actuelles ne sont pas négligeables. Sacrifier le choix et le style en faveur de l’intelligence de la mise en page, alors que cette intelligence est déjà disponible pour une fraction du coût avec le codage traditionnel, fait de l’IA une option moins convaincante pour l’instant. Bien sûr, il peut y avoir des adeptes précoces de la technologie qui ne sont pas découragés par certains niveaux de risque commercial lorsqu’ils utilisent des solutions basées sur l’IA pour l’intelligence de la mise en page. Nous croyons nous aussi en l’IA et ce n’est qu’une question de temps avant que nous ne découvrions un moyen rentable d’utiliser ses capacités d’une manière qui soit bénéfique à la fois pour nos clients et pour leurs acheteurs.
Ne vous méprenez pas, nous sommes ravis de la myriade de possibilités qu’offre l’intelligence artificielle. Nous sommes stupéfaits par les nouveaux développements constants et ne pouvons qu’envisager des opportunités positives pour l’avenir. Il serait toutefois irresponsable de recommander l’utilisation de solutions basées sur l’IA à l’heure actuelle , car il ne s’agit pas encore d’options économiquement viables à utiliser pour des projets à grande échelle par rapport aux approches traditionnelles qui donnent les mêmes résultats. Nous sommes impatients de découvrir davantage de recherches et d’expériences basées sur des données concernant des fonctionnalités spécifiques basées sur l’IA que nos clients peuvent appliquer à leur propre secteur d’activité et à leurs profils d’utilisateurs. Nous continuerons à travailler sur l’évaluation des solutions et à étudier l’effet sur les paramètres importants tels que les taux de conversion et la satisfaction des utilisateurs.
C’est à vous de décider si l’IA répond aux besoins de votre entreprise et/ou aux exigences de vos clients, malgré son coût actuellement élevé. Toutefois, ne vous laissez pas influencer par le battage marketing – la diligence raisonnable est aussi cruciale ici que dans toute autre entreprise commerciale.