Libro Blanco
En primer lugar, situemos la Inteligencia Artificial (IA), el Aprendizaje Automático, las Redes Neuronales Profundas… a menudo, estos términos se utilizan indistintamente, pero en esencia, son como bloques de construcción. IA es el término general para cualquier software informático que hace algo «inteligente», como su nombre indica. El aprendizaje automático es un subconjunto de la IA en el que se definen criterios de éxito que permiten a la máquina crear y completar tareas. Las redes neuronales profundas (o aprendizaje profundo) son un subconjunto del aprendizaje automático. En el caso de la imagen fotográfica, estas redes son un conjunto de algoritmos que han establecido nuevos récords de precisión en muchos aspectos, como el reconocimiento, la edición y el procesamiento de imágenes. En principio, la IA tiene múltiples significados y suele ser más un medio para alcanzar un fin que un fin en sí misma.

Hoy en día, la tecnología de IA está irrumpiendo en muchos sectores, como los bienes de consumo y el comercio minorista. En general, la mayoría de los sectores informan de que los casos de uso de la IA en sus empresas están relacionados con la atención y el apoyo al cliente: crear conectividad y ser eficientes a la hora de responder a las necesidades de los clientes.
En lo que respecta a la creación de productos fotográficos, hay algunas áreas en las que la IA es realmente una herramienta excelente para conseguir valor y mejorar la experiencia del cliente, y otras áreas en las que la IA sigue requiriendo una financiación importante y consideraciones de desarrollo intrincadas. He aquí algunos ejemplos del valor de la IA en nuestro ámbito:
- La extracción de contexto y el reconocimiento facial y de contenido permiten identificar a las personas, averiguar qué hay en la foto, cómo se siente la gente, detectar zonas de interés para el recorte automático. Google Fotos es un gran ejemplo de aprendizaje automático en funcionamiento
- Calidad y pertinencia de las fotos y mejora automática de la imagen para sugerencias automáticas tras cargar las fotos. Productos como Perfectly Clear by EyeQ o Adobe Lightroom reflejan esto.
- La agrupación de fotos relacionadas permite contar mejor la historia al evitar poner fotos de dos eventos diferentes en la misma página(Importante tener en cuenta: esto suele ser más útil y barato mediante la agrupación por fecha de toma y por delta, en lugar de por IA).
- Geoetiquetado de imágenes mediante el análisis del contenido de las fotos (es decir, los píxeles, no los metadatos), incluso sin sistemas GPS incorporados, para componer fácilmente proyectos de viaje.
- La mayoría de los fabricantes ofrecen filtros como el «embellecimiento» automático, efectos artísticos, etc. en el software de la cámara y en muchas aplicaciones.
- Bots de chat y asistencia automatizada para proporcionar ayuda basada en preguntas frecuentes.
- Creación automática de proyectos, como la maquetación automática, aunque en este caso la IA todavía no es la candidata ganadora si se compara con los scripts codificados existentes o con un diseñador humano, salvo en los casos más sencillos, en los que los algoritmos tradicionales a menudo pueden hacer un trabajo razonable por menos dinero.
En resumen, actualmente en fotografía, el rendimiento de la IA se optimiza para la creación y edición de imágenes; los algoritmos se diseñan principalmente para simplificar y mejorar la calidad de la imagen y el proceso de edición, por imagen o como grupo/categoría.
En la actualidad, el equipo de Investigación y Desarrollo de Mediaclip está investigando enfoques creíbles y económicos para seleccionar grandes conjuntos de imágenes de múltiples dispositivos (teléfonos, cámaras) y entornos de archivo (Google Photo, Facebook, ordenador) y crear contenidos complejos lógicos, como un fotolibro. Nuestras investigaciones pretenden descubrir cómo la IA puede crear un valor real y cuantificable para empresarios y consumidores mejorando el proceso de selección de fotos y proporcionando un mejor contexto para la creación automatizada de productos, sin dejar de guiarse por decisiones de diseño y por diversos expertos. La IA sigue teniendo importantes costes financieros y medioambientales, y las métricas más importantes que hay que seguir son cómo afecta a las tasas de conversión y a la satisfacción de los usuarios.
¿Puede la IA interpretar la percepción humana para la selección de fotos y proyectos?
El software de edición AI contiene conjuntos de instrucciones sobre la calidad óptima de una imagen, en términos de contenido, reproducción, densidad, iluminación e incluso recorte. Estas instrucciones se han reunido bajo un conjunto específico de algoritmos; estos conjuntos de instrucciones se basan en 150 años de experiencia fotográfica y control de calidad.
Por ejemplo, el equipo de Luminar AI indica que ha colaborado con los mejores fotógrafos para entrenar su red neuronal de software, por lo que es casi como si cada imagen fuera analizada por este equipo de expertos en fotografía. Sin embargo, el resultado final puede no ser del agrado del usuario y la decisión final de aceptar la corrección debe tomarse por imagen, ya que el software puede malinterpretar el contenido de la imagen y su impacto deseado en el argumento.
Seleccionar fotos y completar un proyecto personalizado es el nombre del juego para minoristas y consumidores por igual. Al mismo tiempo, queremos garantizar la mejor experiencia para nuestros usuarios, y asegurarnos de que tengan el mayor grado de control, transparencia y eficiencia mientras trabajan en proyectos más complicados y de mayor compromiso, como los álbumes de fotos. Con el tiempo, la IA y el aprendizaje automático deberían ayudar al proceso creativo, pero de momento no.
¿Por qué? Porque la inserción de estos algoritmos complejos y de alto nivel para una mejor selección de imágenes, un contenido agradable y una narración precisa requiere un análisis informático especial, múltiples exploraciones y la clasificación de cada imagen en un conjunto seleccionado. Estos esfuerzos llevan mucho tiempo y requieren costosos recursos informáticos en la actualidad.
Es necesario integrar un importante conjunto de instrucciones diversificadas (línea de tiempo, metadatos, reconocimiento facial, juicio de buen comportamiento, descifrar entre imágenes útiles e inútiles), todas las cuales deben evaluarse a partir de un gran conjunto de datos de imágenes de consumidores para proponer una selección automatizada de imágenes agradable y eficaz con un solo clic. Actualmente, la mayoría de los sitios de comercio electrónico no disponen de estos recursos. Nick Burns, científico de datos, sostiene que por muy buenos que sean los modelos de IA, sólo están a la altura de los datos de que disponen.
Por lo tanto, utilizar la IA y el aprendizaje automático para realizar la selección del contenido de la imagen en un conjunto pequeño e incluso grande de imágenes que transmitan la emoción y la historia deseadas puede seguir siendo todo un reto. Por ejemplo, en una serie de retratos, el reconocimiento facial es importante sin lugar a dudas. Pero, ¿está el sujeto guiñando un ojo o parpadeando? ¿Está bien posado? ¿O sonríen todos en una foto de grupo? Si no es así, ¿qué imagen es la mejor para seleccionar? En otras circunstancias, ciertos criterios establecidos que proporcionan el «conocimiento» a la IA pueden no ser óptimos para la memoria real. Por ejemplo, una foto con poca luz puede transmitir la sensación adecuada y no debe rechazarse ni autofijarse, o ciertas «imperfecciones» del sujeto le dan su carácter/individualidad y no deben suavizarse. Debido a matices como éstos, las selecciones y correcciones de imagen propuestas deben ser confirmadas por el usuario.
Como parte de nuestros esfuerzos de investigación y desarrollo, estamos experimentando con las posibilidades de integración de estos sofisticados algoritmos desde una perspectiva económica y tecnológica. Nuestro proceso para lograr una selección óptima de imágenes con un solo clic se revisa periódicamente para garantizar que ofrece el mejor escenario posible para nuestros clientes, sus consumidores y el proceso en general. Actualmente, nos centramos en mejorar los algoritmos que simplifican y optimizan el contenido de diseños de página complejos. En nuestro análisis, esto produce un mayor retorno de la inversión para la empresa y una experiencia más intuitiva para el usuario final.
En resumen, las redes neuronales profundas de IA requerirían años de análisis de datos sobre las percepciones de imágenes o recuerdos del usuario, además de su intención y comportamiento, para ser lo suficientemente eficientes como para realizar sugerencias de imágenes y proyectos complejos con un solo clic. Las capas y la profundidad de una mente humana a la hora de tomar decisiones (entre otras cosas) son indudablemente más sofisticadas que la IA y es poco probable que puedan reproducirse fácilmente en un futuro próximo.
Inteligencia artificial frente al desarrollo de software tradicional para lograr proyectos fotográficos automatizados con un solo clic (como los álbumes de fotos) en 2021.
Como ya hemos comentado, la IA y el aprendizaje automático ayudan mucho a gestionar y mejorar las imágenes (por ejemplo, correcciones automáticas, agrupación de sujetos, reconocimiento facial y de objetos, etc.) Las funciones que ofrece el software respaldado por IA son cada vez mejores y pueden abordar más problemas a una velocidad asombrosa. Muchas soluciones de personalización de productos la utilizan para enriquecer la experiencia del usuario. En situaciones en las que las imágenes ya están disponibles para su análisis, como en soluciones de archivo como Google Fotos o aplicaciones móviles en las que las fotos ya están en un único dispositivo, la IA aporta un valor extraordinario a la hora de catalogar las colecciones de imágenes de los usuarios de forma significativa y útil. En algunos casos, puede incluso utilizar esa catalogación para proponer productos con opciones de diseño limitadas.
La limitada opción de diseño es el problema central aquí. La IA es una herramienta excelente para extraer un subconjunto significativo de imágenes de una colección más amplia, y puede ayudar a adivinar una secuencia cuando hay un contexto común, como una boda o una sesión de fotos. Sin embargo, la IA no sirve para crear un diseño de calidad ni para aprovechar al máximo las imágenes.
¿Por qué no utilizar la IA también en el diseño de productos?
Para responder a esta pregunta, comparemos la inteligencia artificial con el desarrollo «normal» de software por desarrolladores experimentados. Ambos enfoques proporcionan un marco de herramientas que potencialmente permiten construir diseños, pero ninguno sabe nada sobre diseño. La inteligencia artificial, y más concretamente el aprendizaje automático, puede averiguar cómo hacer algo basándose en grandes conjuntos de datos y criterios de éxito. Crear datos significativos y ajustar lo que se considera un «diseño de éxito» es extremadamente costoso y lleva mucho tiempo. Donde la IA brilla es en escenarios donde no es trivial codificar lo que constituye una buena implementación. En el caso del diseño de un libro, sin embargo, podemos codificar lo que constituyen buenas decisiones de diseño. Los expertos en diseño pueden proporcionar márgenes seguros y normalizados, así como reglas estéticas y de maquetación basadas en el contenido, y aplicarlas por una fracción del coste, sin dejar de ofrecer variedad. Claro que el tema negro con una foto por página funciona, pero seguir alimentando a los usuarios con contenidos nuevos, interesantes y relevantes sigue siendo mucho más rentable con las herramientas tradicionales.
Pero al final, no tenemos que elegir entre inteligencia artificial y desarrollo de software tradicional. Ambos pueden utilizarse para crear grandes soluciones. Por ejemplo, podemos utilizar los puntos fuertes de la inteligencia artificial actual para alimentar los algoritmos tradicionales con información significativa, como si una foto tiene mayor pertinencia que otra, sin que necesariamente determine dónde debe estar esa foto en una página.
Actualmente, el uso de la inteligencia artificial en todo su potencial está restringido por su coste total de propiedad. Resulta difícil conectar económicamente todos los componentes necesarios para sacar el máximo partido de todos estos datos. Los costes de las licencias, los requisitos informáticos, el menor rendimiento y la disminución de los ingresos finales son los principales obstáculos para su adopción a gran escala.
Una pregunta realista que deberíamos hacernos como industria es si todas esas funciones que aporta la inteligencia artificial son realmente necesarias. En teoría, tener fotos agrupadas por colores, descartar imágenes en función de la calidad y utilizar metadatos avanzados para tomar decisiones de diseño es genial y permite hacer presentaciones increíbles, pero ¿impulsarán realmente la venta? ¿Qué entusiasmará al cliente y entenderá lo que está pasando? ¿Debemos educar a los usuarios finales sobre lo que la IA puede aportarles, o simplemente debemos simplificarles las cosas?
Todavía tenemos que defender las características individuales de la inteligencia artificial, de modo que invertir en ellas en este momento pueda generar ingresos y mejorar la experiencia del usuario hoy. A la velocidad a la que se producen las innovaciones en inteligencia artificial, podemos esperar que las posibilidades «financieramente viables» sigan creciendo. También podemos esperar más datos sobre lo que funciona y lo que no, para poder justificar las inversiones.
Exploremos también por qué la estética del proyecto propuesto por la IA es importante y supone una barrera clave para su adopción generalizada. Imagina que un sistema de IA actual tuviera que crear un fotolibro a partir de tus fotos. ¿Dejarías que eligiera las fotos que saldrán (o no) sin mirarlas? ¿Confiarías en que adivinara si es para un regalo, una boda o un simple recuerdo familiar? ¿Te conformarías con páginas sólo en negro e imágenes centradas? ¿Le gustaría elegir cuánto quiere pagar por ese producto y el nivel de calidad del papel, la encuadernación, etc.? Y, quizá lo más importante, ¿cree que esas respuestas pueden ser las mismas para todos?
La construcción de productos totalmente automatizada requiere algoritmos de discriminación predeterminados, que pueden basarse en «lo que suele funcionar» o en datos cuidadosamente seleccionados por el usuario. Entonces, ¿puede la IA elegir realmente una secuencia estética lógica sin algunas instrucciones contextuales del consumidor? Bueno, sí, siempre que esté de acuerdo con un libro genérico. E incluso entonces, hacer un libro genérico con el desarrollo de software tradicional será mucho más barato y fácil de mejorar a medida que se aprende sobre el mercado específico.
La IA puede ayudar a gestionar grandes conjuntos de datos y a tomar decisiones automatizadas, como la clasificación de imágenes y la comprensión de lo que hay en una imagen, pero, de nuevo, a un coste elevado y con retrasos adicionales desde el punto de vista del usuario debido a la carga de trabajo informático necesaria, especialmente en el contexto de una tienda de comercio electrónico. Analizar un gran conjunto de fotos subidas para reagruparlas, categorizarlas y ponerlas en una secuencia agradable en los sitios web puede añadir fácilmente unos cuantos dólares por libro creado, independientemente de si se ha pedido o no. ¿Merece la pena el riesgo financiero por los ingresos adicionales? Piense en lo siguiente:
- Cuando los compradores entran en un sitio y cargan grandes cantidades de fotos para sus proyectos, pero una media del 20% acaba por no comprar, la empresa incurrirá en costes informáticos que no se compensan en su totalidad con las ventas.
- Analizar cargas voluminosas de fotos puede llevar varios minutos. Los consumidores perciben este «crujido» como un retraso significativo en la producción. Los consumidores de hoy, impulsados por la velocidad, no aceptan los retrasos, aunque estén justificados por análisis complejos, y estos retrasos afectan a las tasas de conversión.
- El coste de ingeniería de encadenar y poner en marcha estos bloques de construcción de IA para crear trazados autosugeridos es muy caro. Dado que los recursos necesarios cambian constantemente, los conocimientos, la tecnología y los futuros requisitos de ingeniería son escasos y caros.
Aunque Mediaclip evalúa constantemente la IA y otras tecnologías progresistas, hemos descubierto que es más flexible y rentable escribir algoritmos que realicen tareas inteligentes como reagrupar fotos, generar temas de producto agradables, optimizar escenarios de maquetación de libros y colocar de forma interesante una o muchas imágenes respetando su proporción de contenido de imagen en cada página/superficie individual, todo ello a un precio razonable y con el apoyo de un diseño experto, conservando la variedad que esperan los consumidores.
Por qué Mediaclip no se subirá al tren de la inteligencia artificial… todavía
El equipo de I+D de Mediaclip experimenta constantemente con distintas opciones para conseguir fotolibros ricos que cuenten una historia permitiendo a los usuarios expresarse y equilibrando al mismo tiempo el tiempo que se tarda en crearlos. Hoy en día vemos muchas técnicas que nos ayudarán a utilizar la IA de muchas formas muy útiles, pero no hemos encontrado una solución que pueda sustituir a los diseños y algoritmos cuidadosamente elaborados de forma rentable.
Hay cosas específicas que aún tenemos que ver antes de recomendar la IA como motor principal para la personalización de productos:
Creación de diseños y composiciones atractivos: nuestro sistema de diseño inteligente ya permite crear diseños ricos e interesantes que se adaptan a todo tipo de acontecimientos vitales y estilos de productos. Los usuarios pueden reorganizar y recomponer fácilmente sus páginas basándose en los mejores diseños posibles para sus necesidades. Los servicios de inteligencia de imagen existentes pueden ayudar a mejorar automáticamente las imágenes o a recortarlas automáticamente cuando el diseño lo requiera, por ejemplo al utilizar contenidos con licencia. Todo esto está disponible actualmente sin necesidad de utilizar herramientas basadas en IA.
Rentabilidad : actualmente existen dos métodos para ofrecer servicios basados en IA: la IA de cliente (normalmente disponible en dispositivos móviles para escanear la biblioteca de imágenes de un usuario) y la IA de servidor. Existen algunas soluciones excelentes para ofrecer recomendaciones de productos en un dispositivo móvil; sin embargo, ambos métodos pueden ser mucho más caros que sus homólogos sin IA. Nota: creemos que (específicamente) para las capacidades de «descubrimiento de fotos» y curación de aplicaciones móviles, la IA ofrece opciones muy sólidas a tener en cuenta hoy en día.
Control sobre el resultado. La IA, y más concretamente el aprendizaje automático, es excelente a la hora de adivinar un método que reproducirá lo que le indiques. Sin embargo, esto también reduce en gran medida tu capacidad de ajustar y adaptar el algoritmo a tus necesidades. Si crees que una imagen debería tratarse de forma ligeramente diferente, o si tu equipo de diseño quiere tomar una decisión de diseño específica basada en la orientación de una imagen, estarán muy limitados.
Pudimos crear demos impresionantes utilizando soluciones existentes e ideas de prototipos con software propietario y de código abierto. Sin embargo, nuestros esfuerzos de desarrollo se centran en las tasas de conversión, la satisfacción de los usuarios y el aumento de los ingresos para nuestros clientes y socios, no en hacer demostraciones «chulas». No estamos satisfechos con las soluciones actuales y no podemos recomendar subirse al barco de la IA por el momento. Sin embargo, creemos que es un campo en el que merece la pena invertir tiempo y dinero, ya que los costes asociados disminuyen y las ofertas mejoran.
En conclusión, creemos que la IA es una herramienta extraordinaria, aunque cara, para ayudar a la selección de fotos en dispositivos móviles y en sitios de alojamiento de fotos. También puede proporcionar información significativa sobre el contenido de los usuarios y ayudar a orientar la presentación y la comunicación con los usuarios en el sitio web. Sin embargo, estos conocimientos y ventajas tienen un coste que no hace que sea una decisión fácil de tomar. Tenga en cuenta que la Inteligencia Artificial no es una característica; no hace nada por sí misma. Es un método que puede resolver eficazmente determinadas categorías de problemas. ¿Recuerdas el dicho «cuando tienes un martillo, todo parece un clavo»? Pues en esta conversación, la IA es un martillo de demolición; es una herramienta muy útil para tener en el cobertizo, pero no te ayudará a decorar.
Las limitaciones de las soluciones actuales de IA no son desdeñables. Sacrificar la elección y el estilo en favor de la inteligencia de diseño, cuando esa inteligencia ya está disponible a una fracción del coste con la codificación tradicional, hace que la IA sea una opción menos convincente por ahora. Por supuesto, es posible que haya pioneros de la tecnología que no se dejen disuadir por ciertos niveles de riesgo empresarial a la hora de utilizar soluciones basadas en IA para la inteligencia de diseño. Nosotros también creemos en la IA y es sólo cuestión de tiempo que descubramos una forma rentable de utilizar sus capacidades de manera beneficiosa tanto para nuestros clientes como para sus compradores.
No nos malinterprete, estamos encantados con las innumerables posibilidades de la inteligencia artificial. Nos asombran los constantes nuevos avances y sólo podemos vislumbrar oportunidades positivas de cara al futuro. Sin embargo, sería irresponsable recomendar el uso de soluciones basadas en IA en este momento, ya que todavía no son opciones económicamente viables para proyectos a gran escala en comparación con los enfoques tradicionales que producen los mismos resultados. Estamos impacientes por descubrir más investigaciones basadas en datos y experimentos sobre funciones específicas basadas en IA que nuestros clientes puedan aplicar a su propio sector empresarial y a las personas usuarias. Seguiremos trabajando en la evaluación de soluciones y en la investigación del efecto sobre métricas importantes como las tasas de conversión y la satisfacción del usuario.
Por supuesto, usted decide si la IA responde a las necesidades de su empresa o a las demandas de sus clientes a pesar de su elevado coste actual. Sin embargo, por favor, hágalo al margen del bombo publicitario: la diligencia debida es tan crucial aquí como en cualquier otra aventura empresarial.