des clés pour éviter les erreurs les plus absurdes

En plus de nous offrir toutes sortes de réponses et d’aides, les différentes solutions axées sur l’intelligence artificielle vont bien plus loin. Ces derniers temps, nous avons vu comment créer, de manière générative, des éléments tels que des photos, des vidéos ou des codes de programmation.

En fait, à ce stade, nous pouvons dire que dans la plupart des cas, en laissant toujours de côté les textes, l’une des utilisations les plus courantes de l’IA par les utilisateurs sont les images. Et bon nombre de ces plates-formes, en grande partie grâce à leurs avancées modèles de langagenous permettent d'éditer et de créer des images originales à partir d'une série de termes.

Cela signifie que, d'une part, nous avons la possibilité de télécharger notre propre image et de la modifier en donnant une série de commandes sous forme d'invite. Mais il est également assez courant, comme beaucoup d'entre vous l'ont sûrement vu à plusieurs reprises, d'essayer créer des images à partir de zéroégalement à partir d'une série de termes que nous indiquons à la plateforme.

En fait, à ce stade, la plupart des assistants intelligents, tels que ChatGPT ou Gémeauxils sont formés pour tout cela que nous vous disons. Mais même les modèles de langage les plus avancés et les plus actuels commettent parfois de graves erreurs lors de la génération automatique de ces images. On retrouve ainsi des erreurs qu'on ne devrait pas voir sur les plateformes d'IA de ce niveau, mais qui sont parfois extrêmement décevantes.

Et vous savez déjà que ces plateformes intelligentes ne sont pas parfaites, ni lorsqu'il s'agit de générer des textes, ni des images, ni codes de programmation. Nous allons maintenant nous concentrer sur la façon d'essayer d'éviter, dans la mesure du possible, les erreurs d'interprétation de la part de l'IA lorsqu'il s'agit de nous fournir des photos de manière générative.

Comment obtenir des photos générées par l'IA, sans erreur

Nous devons garder à l’esprit qu’une partie de la responsabilité de ces erreurs dans les images génératives nous incombe. La raison principale de tout cela est que l’intelligence artificielle n’est pas toujours capable de comprendre certains termes ou expressions que nous utilisons dans les invites. La meilleure chose à faire est donc d'éviter, autant que possible, tout ce que nous allons mentionner ci-dessous afin d'obtenir des images plus précises et éviter les erreurs dans sa création.

Images générées par l'IA dans l'assistant ChatGPT d'OpenAI avec divers échantillons à l'écran. Photo : capture SoftZone.

Expressions faciales indésirables. L’une des erreurs les plus courantes consiste à trouver des expressions sur des visages humains qui semblent quelque peu étranges, voire impossibles. Pour éviter cela, la meilleure chose à faire est d’utiliser des adjectifs plus précis pour définir ces expressions faciales.

Erreurs lors de la lecture des icônes et des logos. De nombreux utilisateurs finaux et entreprises utilisent aujourd’hui l’IA pour générer des logos et des icônes. Mais la vérité est que ce mode d’utilisation n’est généralement pas très efficace pour la plupart des plateformes intelligentes. L’une des raisons est que les participants essaient d’éviter les problèmes de droits d’auteur. C'est pourquoi la meilleure chose que nous puissions faire est d'éviter l'utilisation de marques déposées et spécifiques dans l'invite.

Photos avec des éléments qui se chevauchent. Il est évident que la génération d’images complexes avec de nombreux éléments se chevauchant peut constituer un problème pour ces plateformes. Pour le moment, la seule solution consiste à générer des images plus simples individuellement, puis à utiliser un logiciel d'édition pour résoudre le problème.

Emplois avec des célébrités. Nous devons également garder à l’esprit que bon nombre de ces plateformes d’IA sont verrouillées pour certains types d’utilisation. La plupart d’entre eux ne nous permettent pas de générer ou de modifier implicitement des images de personnes ou de célébrités connues, nous ne pouvons donc pas y faire grand-chose.

Erreur courante Exemple d'invite de base (problématique) Exemple d'invite amélioré (solution) Principe clé
Des expressions faciales étranges « Une femme heureuse » « Portrait photographique d'une femme de 30 ans, au sourire sincère et chaleureux, montrant légèrement les dents, avec des pattes d'oie autour des yeux, un éclairage tamisé des fenêtres. » Spécificité émotionnelle et physique.
Logos déformés ou génériques « Un logo pour un café, style Starbucks » « Logo minimaliste pour un café : emblème circulaire avec une sirène stylisée dans les tons vert et blanc, sans texte, sur fond neutre . » Décrivez les éléments visuels, pas la marque.
composition chaotique « Un paysage avec une rivière, des montagnes et un château » « Paysage épique. Un château médiéval en pierre au sommet d'une colline à droite. Une rivière serpente de la gauche à l'arrière-plan. Des montagnes enneigées à l'horizon lointain. Lumière du soir . » Définissez la position relative des éléments.
Anatomie incorrecte (par exemple les mains) « Une personne qui écrit » « … (invite principale). Invite négative : mains déformées, six doigts, doigts fusionnés, membres supplémentaires. Utilisation d'invites négatives pour exclure les erreurs.