__

Ideogram, une nouvelle IA de génération d’images impressionnante

Ideogram, un nouvel outil d'intelligence artificielle qui génère des images magnifiques.

Plusieurs anciens de Google ont dévoilé fin août 2023 Ideogram AI, une intelligence artificielle générative qui crée de magnifiques images, à un niveau assez proche de ce que propose MidJourney.

Auteur / Autrice :

Ideogram, une nouvelle IA pour générer des images

On apprenait aujourd’hui que MidJourney déploie une nouvelle fonctionnalité très intéressante : il est désormais possible de retoucher seulement une partie d’une des superbes images que le programme produit. Un programme d’intelligence artificielle qui semble à l’heure actuelle le plus performant du marché, et de loin.

Citons parmi les concurrents les plus connus le très défectueux Dall-E de OpenAI, qui griffonne des horreurs plus qu’il n’imagine des images. Mais aussi Stable Diffusion, un modèle beaucoup plus intéressant, très qualitatif, régulièrement mis à jour (même si à titre personnel je ne suis pas convaincue par la direction artistique choisie pour la dernière version majeure sortie de SDXL). Quelques autres outils se font un petit nom au sein du grand public, comme le très sur-côté Stockimg.ai (outil favori des scammer IA de Twitter), et le pas trop mauvais Craiyon.

Outre l’excellente qualité des images qu’il produit, Stable Diffusion a un avantage conséquent sur les différents modèle IA cités, et en premier lieu sur MidJourney : il est entièrement gratuit, et accessible de manière simple via internet. Pas de carte bleue, et pas de chat infernal et anarchique sur Discord. Quant aux autres : Dall-E et Craiyon sont nuls et gratuits, et Stockimg est nul et payant.

Mais un nouveau nom pourrait bien avoir son mot à dire dans cette course à la suprématie : Ideogram.

Dévoilé le 22 août 2023, Ideogram AI est un nouvel outil d’intelligence artificielle générative spécialisé dans la création d’images. Un outil lancé par une équipe “composée d’experts en IA de renommée mondiale, qui ont précédemment dirigé des projets d’IA transformateurs chez Google Brain, UC Berkeley, CM et l’Université de Toronto”, d’après le communiqué fait sur le site officiel du projet.

Parmi les principaux créateurs de Ideogram : Mohammad Norouzi, William Chan, Jonathan Ho (ex OpenAI et ex Google) et Jenny Lei. Une équipe qui a un bagage impressionnant dans l’univers et le développement de l’IA contemporaine :

“Nos travaux fondamentaux dans le domaine de l’IA comprennent :

  • Denoising Diffusion Models,
  • Imagen : le système de conversion de texte en image de Google,
  • Imagen Video pour la synthèse vidéo,
  • WaveGrad pour la synthèse vocale,
  • La reconnaissance neuronale de la parole,
  • La traduction automatique neuronale,
  • L’apprentissage contrastif pour l’apprentissage de représentations visuelles,
  • L’apprentissage génératif contradictoire de l’imitation.”

Une entreprise qui a aussi déjà bouclé un premier tour de table conséquent, avec un total de 16,5 millions de dollars levé dans le cadre d’une phase d’amorçage, via les très réputés a16z et Index Ventures.

Un Midjourney killer ?

Ideogram est donc une IA générative qui crée des images, et des images de qualité, un point basique mais particulièrement important (coucou Dall-E). Un autre point intéressant avec Ideogram : comme pour MidJourney, on a accès en temps réel aux autres images générées par les autres utilisateurs.

La galerie d’images générées en temps réel dans Ideogram.

Et à l’heure d’essayer l’outil, et d’écrire ces lignes, un trend “Midjourney is over” est en cours sur Ideogram, ce qui a donné certaines images utilisées ici !

Avec Ideogram, adieu Midjourney ?

Plus largement, Ideogram est un très bon outil, capable de décliner une vaste palette de type d’images, du manga aux photographies, en passant par les caricatures et les paysages. Avec les images qui sont affichées dans la galerie principale, on retrouve les prompts utilisés par les créateurs, un petit plus très bienvenu.

“Shrek as obama”

Et lorsqu’on clique sur une image, Ideogram nous propose toujours la gamme de quatre images qui a été générée pour le prompt en question

“Shrek as obama”

Test d’Ideogram : une qualité impressionnante, bien meilleure que chez certains concurrents

Comme beaucoup de nouveaux outils d’intelligence artificielle, Ideogram n’est pas encore bien paramétré pour prévenir des dérives possibles, et il est très facile de générer des images à la moralité douteuse (voire pire, je n’ai pas été trop loin dans cette direction), comme ces images de fillette en maillot de bain :

Un problème que Craiyon a aussi, même si les images photoréalistes de Craiyon sont particulièrement mauvaises (voir plus bas). Stable Diffusion est aussi sujet à ce problème, dans une moindre mesure. Ideogram a néanmoins un filtre qui fonctionne avec la liste de mots clefs habituels de ce genre d’outils : hot, sexy, etc…

Ideogram permet de générer des images dans trois formats pour le moment : 1/1 (carré), 10/16 (portrait) et 16/9 (portrait). L’outil propose aussi une vingtaine de type d’image pré-formaté (comme Stable Diffusion par exemple) : vibrant, graffiti, architecture, illustration, poster…

Premier test

Pour comparer les résultats de Ideogram avec d’autres outils, voici les sorties proposées par plusieurs outils avec le prompt suivant : “a beautiful blond hair girl with deep blue eyes, full body, in a yellow swimwear”.

  • Dall-E :
Image générée par l'intelligence artificielle Dall-e avec l'invite texte "a beautiful blond hair girl with deep blue eyes, full body, in a yellow swimwear"
  • Stable Diffusion :
Image générée par l'intelligence artificielle Stable Diffusion avec l'invite texte "a beautiful blond hair girl with deep blue eyes, full body, in a yellow swimwear"
  • Craiyon
Image générée par l'intelligence artificielle Craiyon avec l'invite texte "a beautiful blond hair girl with deep blue eyes, full body, in a yellow swimwear"
  • Ideogram
Image générée par l'intelligence artificielle Ideogram avec l'invite texte "a beautiful blond hair girl with deep blue eyes, full body, in a yellow swimwear"

(N’étant plus abonnée à MidJourney, l’outil n’est pas intégré à ce comparatif.)

Second test

Un second test avec l’invite suivante : “A big pink cat with big turquoise eyes, drawn in a satirical manga style.”

  • Dall-E
Image générée par l'intelligence artificielle Dall-e avec l'invite texte "A big pink cat with big turquoise eyes, drawn in a satirical manga style."
  • Craiyon :
Image générée par l'intelligence artificielle Craiyon avec l'invite texte "A big pink cat with big turquoise eyes, drawn in a satirical manga style."
  • Stable Diffusion
Image générée par l'intelligence artificielle Stable Diffusion avec l'invite texte "A big pink cat with big turquoise eyes, drawn in a satirical manga style."
  • Ideogram
Image générée par l'intelligence artificielle Ideogram avec l'invite texte "A big pink cat with big turquoise eyes, drawn in a satirical manga style."

Troisième test

Enfin, un dernier test en utilisant un prompt trouvé directement sur Ideogram, que j’ai trouvé pertinent pour tenter un comparatif : “Cinematic film still, Keanu Reeves as Draco Malfoy from Harry Potter”

  • Dall-E
Image générée par l'intelligence artificielle Dall-E avec l'invite texte "Cinematic film still, Keanu Reeves as Draco Malfoy from Harry Potter"
  • Craiyon
Image générée par l'intelligence artificielle Craiyon avec l'invite texte "Cinematic film still, Keanu Reeves as Draco Malfoy from Harry Potter"
  • Stable Diffusion
Image générée par l'intelligence artificielle Stable Diffusion avec l'invite texte "Cinematic film still, Keanu Reeves as Draco Malfoy from Harry Potter"
  • Ideogram
Image générée par l'intelligence artificielle Ideogram avec l'invite texte "Cinematic film still, Keanu Reeves as Draco Malfoy from Harry Potter"

Trois tests qui permettent de comparer les outils mais la meilleure manière de les jauger est encore de les prendre en main par soi-même. Enfin, pas Dall-E, mais les autres oui.

Pour tester Ideogram : https://ideogram.ai/