December 26, 2024 • 5 min read

4 clés pour concevoir un produit de génération d’images en tant que Product Manager

Rédigé par Agathe A.

Agathe A.

Introduction : Les défis des Product Managers face à la génération d’images

Avec l’essor de l’IA Générative, des outils comme le Generative Fill de Photoshop révolutionnent la création visuelle. Ce type de technologie transforme des secteurs variés : architecture, e-commerce, divertissement, éducation ou encore médical. L'ampleur et la diversité des cas d’usage de la GenAI, comme illustré dans cet article sur son histoire et ses applications, montrent à quel point ces innovations s’inscrivent dans des contextes multiples.

Pour les Product Managers, un certain nombre de défis se posent. Comment s’assurer que la technologie réponde aux besoins réels des utilisateurs ? Comment gérer les retours subjectifs tout en alignant les équipes techniques et créatives ? Et surtout, comment définir et partager une vision claire de la qualité d’une image générée ?

Cet article propose quatre clés pour relever ces défis et garantir la réussite des projets de génération d’images.

1ère clé : Comprendre le métier pour identifier les leviers de valeur

L’étape de Product Discovery dans un projet de génération d’images ne se limite pas à identifier les besoins exprimés par les utilisateurs. Il s’agit aussi de cartographier leur flux de travail pour repérer où l’IA peut apporter une réelle valeur. Cela nécessite une attention particulière à des aspects spécifiques, comme les formats d’images requis, la qualité attendue, les critères d’évaluation, les ajustements, et l’intégration aux outils existants. Cette démarche implique de s’immerger dans leurs processus métier, et de cerner les étapes critiques qui impactent directement leur efficacité et leurs résultats.

Par exemple, dans un projet destiné à des architectes, savoir qu’ils ont besoin rapidement de croquis précis n’est qu’un point de départ. Il faut aller plus loin : comment les utilisateurs passent-ils des premières esquisses à la modélisation 3D ? Où perdent-ils le plus de temps ? Quelles étapes nécessitent une intervention humaine que l’IA ne peut remplacer ? Ces réflexions permettent de cibler des points de friction, comme le temps consacré à ajuster des modèles pour des présentations clients, où l’IA peut leur offrir un véritable gain en efficacité.

En comprenant ces enjeux, les Product Managers peuvent ainsi transformer des idées vagues en user stories claires et actionnables, alignées sur des besoins réels.

2e clé : Traduire les besoins en fonctionnalités au moyen d’une approche structurée

La clé pour concevoir des fonctionnalités pertinentes réside dans la priorisation des fonctionnalités à développer, basée sur les retours utilisateurs. Les ateliers et interviews par exemple aident à identifier et prioriser les besoins essentiels. En structurant ces retours, les équipes peuvent se concentrer sur des attentes concrètes et éviter de perdre du temps sur des fonctionnalités secondaires. Comme l’explique cet article sur l’apprentissage des succès et des échecs pour créer des bons produits d’IA , intégrer les retours utilisateurs et expérimenter dès les premières étapes est une méthode efficace pour affiner et développer des produits IA adaptés aux besoins réels.

Dans un projet de génération d’images, il est crucial que chaque fonctionnalité réponde à des critères esthétiques précis tout en respectant les contraintes techniques. Cela passe par :

  • Des références visuelles claires, issues des données existantes produites par les utilisateurs, pour aligner les attentes sur le rendu final.
  • Une grille d’évaluation structurée, intégrant des critères comme le réalisme, le style de trait, l’atmosphère générale, et la conformité à une image de référence, etc.
  • Une prise en compte des limites techniques, comme les difficultés du modèle à générer des textures ou des ombres, afin de prioriser les axes d’amélioration les plus impactants.
Type de critère Critère Description
Esthétique Style de trait Épaisseur et régularité des traits : lignes précises et nettes pour le premier plan, plus floues pour l’arrière-plan
Esthétique Cohérence des couleurs Palette définie en fonction de l’objet de l’image: teintes neutres pour des rendus techniques, ou vives pour des visuels plus dynamiques
Esthétique Style de trait Outil simulé pour le rendu visuel, comme un tracé au crayon, une finition à l’encre, un effet aquarelle ou un dessin numérique
Technique Gestion des ombres Génération d’ombres réalistes cohérentes selon les sources de lumière
Technique Qualité des textures Diversification des textures pour assurer un rendu réaliste en évitant les incohérences visuelles
Technique Résolution d’image Génération d’images en haute résolution (comme du 4K pour impression) ou résolution plus faible pour des prévisualisations rapides

Exemple d’une grille d’évaluation structurée pour

3e clé : Utiliser des feedbacks qualitatifs ET quantitatifs pour optimiser les itérations

Les projets de génération d’images se heurtent à une particularité : la subjectivité. Contrairement à ce qu’on pourrait penser, mesurer la qualité des résultats n’est pas simple, même dans des projets de génération de texte. Si un texte bénéficie d’une structure relativement fixe (grammaire, orthographe, cohérence), il peut tout de même poser problème sans un jeu de données de test adapté. Pour les images, c’est encore plus complexe, car l’œil humain accepte une grande liberté visuelle : un peu comme si, soudainement, on avait le droit d’écrire "CooMme ça" sans perdre totalement le sens.

Par exemple, dans un projet de génération d’images pour un site e-commerce, visant à créer des visuels de vêtements à partir de descriptions, on peut utiliser deux types de feedback pour affiner le modèle :

  • Quantitatif : Les utilisateurs évaluent les images sur une échelle de 1 à 5 selon des critères précis comme la fidélité au produit réel, la luminosité, et la texture. Cela permet d’obtenir rapidement des axes d’amélioration.
  • Qualitatif : Des commentaires libres peuvent compléter les notes, comme : "Les plis du tissu manquent de réalisme, cela donne l’impression d’une image artificielle."

Avec des retours structurés, il devient possible d’affiner le modèle efficacement, en respectant des attentes parfois complexes à objectiver.

image (21)

Image de référence

image (22)

Image générée 1: Fidélité au produit réel: 2/5, luminosité 3/5, texture 0/5

image (23)

Image générée 2: Fidélité au produit réel: 4/5, luminosité 4/5, texture 5/5

4e clé : Mesurer la valeur du produit via des KPIs spécifiques

Enfin, comment savoir si l’outil apporte une réelle valeur aux utilisateurs ? Ce n’est pas uniquement une question de performance technique, mais aussi d’impact concret sur leur travail quotidien. Les métriques classiques de l’IA, comme la précision (proportion de résultats corrects parmi toutes les prédictions) et le recall (capacité à détecter toutes les réponses correctes), sont pertinentes dans des scénarios très structurés. Toutefois, ces métriques montrent leurs limites lorsqu’il s’agit de génération d’images, où l’évaluation repose également sur des critères qualitatifs comme vu dans le précédent point.

Les indicateurs doivent refléter l’impact du produit sur le travail quotidien des utilisateurs, en prenant en compte le temps global nécessaire pour atteindre un résultat satisfaisant :

  • Taux d’acceptation : Pourcentage d’images jugées exploitables sans modification, indiquant dans quelle mesure l’outil répond directement aux attentes. Il peut s’agir d’une évaluation automatique, par exemple les images sont validées si elles obtiennent une note moyenne supérieure à un seuil prédéfini (comme 4/5), sur des critères objectifs tels que ceux définis plus haut; ou bien une évaluation binaire (image OK ou KO), faite par l’utilisateur sur une interface dédiée.

  • Temps de correction (Tweak Time) : Temps total nécessaire pour rendre une image utilisable, incluant à la fois le travail de l’IA et les ajustements humains. Cet indicateur évalue la productivité globale.

    Prenons le cas d’un projet de génération d’images où le taux d’acceptation est de 80 %. La majorité des images générées sont conservées, mais nécessitent en moyenne 15 minutes de temps de correction. Comparé aux 45 minutes nécessaires pour produire un croquis sans IA, cela représente un gain net de 30 minutes par image exploitable. En revanche, les 20 % restants sont jugés inutilisables ou requièrent des ajustements plus conséquents.

Ces données démontrent un impact significatif sur la productivité, en libérant du temps sur des tâches répétitives et mécaniques. Cela permet aux utilisateurs de se concentrer sur des activités plus intellectuelles, à plus forte valeur ajoutée, tout en révélant des axes d’amélioration pour réduire encore les ajustements nécessaires.

Conclusion

Réussir un projet de génération d’images repose sur une compréhension fine des spécificités propres à ce type de projet. Cela inclut l'identification précise du flux de production des images, la traduction des besoins des utilisateurs en matière de qualité visuelle, l’intégration de retours qualitatifs et quantitatifs pour affiner les rendus, et l’adaptation continue des KPIs pour mesurer non seulement les performances techniques mais aussi l’impact sur le travail quotidien des utilisateurs.

En appliquant ces principes, les Product Managers peuvent construire des outils véritablement utiles, qui répondent aux besoins métiers tout en optimisant les processus techniques et créatifs. Ce cadre permet de se différencier des projets plus classiques en prenant en compte les défis uniques liés à la génération d’images.

Si vous avez des retours ou souhaitez échanger sur ces pratiques, n’hésitez pas à me contacter !

Cet article a été écrit par

Agathe A.

Agathe A.