Plusieurs anciens de Google ont dévoilé fin août 2023 Ideogram AI, une intelligence artificielle générative qui crée de magnifiques images, à un niveau assez proche de ce que propose MidJourney.
Auteur / Autrice :
Ideogram, une nouvelle IA pour générer des images
On apprenait aujourd’hui que MidJourney déploie une nouvelle fonctionnalité très intéressante : il est désormais possible de retoucher seulement une partie d’une des superbes images que le programme produit. Un programme d’intelligence artificielle qui semble à l’heure actuelle le plus performant du marché, et de loin.
Citons parmi les concurrents les plus connus le très défectueux Dall-E de OpenAI, qui griffonne des horreurs plus qu’il n’imagine des images. Mais aussi Stable Diffusion, un modèle beaucoup plus intéressant, très qualitatif, régulièrement mis à jour (même si à titre personnel je ne suis pas convaincue par la direction artistique choisie pour la dernière version majeure sortie de SDXL). Quelques autres outils se font un petit nom au sein du grand public, comme le très sur-côté Stockimg.ai (outil favori des scammer IA de Twitter), et le pas trop mauvais Craiyon.
Outre l’excellente qualité des images qu’il produit, Stable Diffusion a un avantage conséquent sur les différents modèle IA cités, et en premier lieu sur MidJourney : il est entièrement gratuit, et accessible de manière simple via internet. Pas de carte bleue, et pas de chat infernal et anarchique sur Discord. Quant aux autres : Dall-E et Craiyon sont nuls et gratuits, et Stockimg est nul et payant.
Mais un nouveau nom pourrait bien avoir son mot à dire dans cette course à la suprématie : Ideogram.
Dévoilé le 22 août 2023, Ideogram AI est un nouvel outil d’intelligence artificielle générative spécialisé dans la création d’images. Un outil lancé par une équipe “composée d’experts en IA de renommée mondiale, qui ont précédemment dirigé des projets d’IA transformateurs chez Google Brain, UC Berkeley, CM et l’Université de Toronto”, d’après le communiqué fait sur le site officiel du projet.
Parmi les principaux créateurs de Ideogram : Mohammad Norouzi, William Chan, Jonathan Ho (ex OpenAI et ex Google) et Jenny Lei. Une équipe qui a un bagage impressionnant dans l’univers et le développement de l’IA contemporaine :
“Nos travaux fondamentaux dans le domaine de l’IA comprennent :
- Denoising Diffusion Models,
- Imagen : le système de conversion de texte en image de Google,
- Imagen Video pour la synthèse vidéo,
- WaveGrad pour la synthèse vocale,
- La reconnaissance neuronale de la parole,
- La traduction automatique neuronale,
- L’apprentissage contrastif pour l’apprentissage de représentations visuelles,
- L’apprentissage génératif contradictoire de l’imitation.”
Une entreprise qui a aussi déjà bouclé un premier tour de table conséquent, avec un total de 16,5 millions de dollars levé dans le cadre d’une phase d’amorçage, via les très réputés a16z et Index Ventures.
Un Midjourney killer ?
Ideogram est donc une IA générative qui crée des images, et des images de qualité, un point basique mais particulièrement important (coucou Dall-E). Un autre point intéressant avec Ideogram : comme pour MidJourney, on a accès en temps réel aux autres images générées par les autres utilisateurs.

Et à l’heure d’essayer l’outil, et d’écrire ces lignes, un trend “Midjourney is over” est en cours sur Ideogram, ce qui a donné certaines images utilisées ici !

Plus largement, Ideogram est un très bon outil, capable de décliner une vaste palette de type d’images, du manga aux photographies, en passant par les caricatures et les paysages. Avec les images qui sont affichées dans la galerie principale, on retrouve les prompts utilisés par les créateurs, un petit plus très bienvenu.

Et lorsqu’on clique sur une image, Ideogram nous propose toujours la gamme de quatre images qui a été générée pour le prompt en question

Test d’Ideogram : une qualité impressionnante, bien meilleure que chez certains concurrents
Comme beaucoup de nouveaux outils d’intelligence artificielle, Ideogram n’est pas encore bien paramétré pour prévenir des dérives possibles, et il est très facile de générer des images à la moralité douteuse (voire pire, je n’ai pas été trop loin dans cette direction), comme ces images de fillette en maillot de bain :


Un problème que Craiyon a aussi, même si les images photoréalistes de Craiyon sont particulièrement mauvaises (voir plus bas). Stable Diffusion est aussi sujet à ce problème, dans une moindre mesure. Ideogram a néanmoins un filtre qui fonctionne avec la liste de mots clefs habituels de ce genre d’outils : hot, sexy, etc…
Ideogram permet de générer des images dans trois formats pour le moment : 1/1 (carré), 10/16 (portrait) et 16/9 (portrait). L’outil propose aussi une vingtaine de type d’image pré-formaté (comme Stable Diffusion par exemple) : vibrant, graffiti, architecture, illustration, poster…
Premier test
Pour comparer les résultats de Ideogram avec d’autres outils, voici les sorties proposées par plusieurs outils avec le prompt suivant : “a beautiful blond hair girl with deep blue eyes, full body, in a yellow swimwear”.
- Dall-E :

- Stable Diffusion :

- Craiyon

- Ideogram

(N’étant plus abonnée à MidJourney, l’outil n’est pas intégré à ce comparatif.)
Second test
Un second test avec l’invite suivante : “A big pink cat with big turquoise eyes, drawn in a satirical manga style.”
- Dall-E

- Craiyon :

- Stable Diffusion

- Ideogram

Troisième test
Enfin, un dernier test en utilisant un prompt trouvé directement sur Ideogram, que j’ai trouvé pertinent pour tenter un comparatif : “Cinematic film still, Keanu Reeves as Draco Malfoy from Harry Potter”
- Dall-E

- Craiyon

- Stable Diffusion

- Ideogram

Trois tests qui permettent de comparer les outils mais la meilleure manière de les jauger est encore de les prendre en main par soi-même. Enfin, pas Dall-E, mais les autres oui.
Pour tester Ideogram : https://ideogram.ai/