__


OpenAI, Google, Meta : Les grands groupes baissent les prix des LLM alors même que leurs IA sont de plus en plus performantes, engageant une guerre des prix dans l’intelligence artificielle.

Guerre des Prix dans l’IA : De meilleurs performances à des tarifs toujours plus bas

Des performances accrues, des prix plus bas : c’est ainsi qu’on peut résumer la guerre entamée récemment entre les principaux éditeurs d’IA génératives basées sur du texte (et construites sur des LLM (Large Language Models)). Et dans le même temps, les LLM ont des fenêtres de contexte plus grandes, prennent en charge une plus large gamme de types d’entrée (images, sons…) et sont plus performants dans les tâches complexes demandant des successions d’actions (demain des agents autonomes ?).

Une guerre annoncée de longue date par Gary Marcus, qui ne se lasse plus depuis de rappeler à quiconque peut encore le découvrir que ses prédictions des 18 derniers mois sont invariablement justes, pour le moment.

Aussi, on observe que les prix d’accès aux grands modèles de langage (LLM) baissent. Une baisse qui vient ainsi de gain de performances côté production : les entreprises (Meta, OpenAI, Google…) exploitent de nouveaux axes pour améliorer leurs efficacités, profitant de retours d’expériences à grande échelle depuis 12 à 18 mois.

Et les entreprises se font concurrence pour attirer de nouveaux clients avec cette guerre des prix.

Illustration : Il y a quelques jours, Open AI a réduit le prix des appels à l’API de GPT-4o de 50% pour les tokens en entrée et de 33% pour les tokens en sortie, avec une réduction encore plus importante pour le traitement asynchrone. Google n’est pas en reste, et a réduit de son côté d’environ 75% le prix des appels à l’API de Gemini 1.5 Flash.

Les prix des Tokens en août 2024

ChatGPT (propulsé par GPT-3.5) est sorti fin novembre 2022, il y a bientôt déjà deux ans.

Il y a à peine six mois, les LLM de pointe comme GPT-4, Claude 2, Gemini 1.0, Llama 2 et Mistral Large étaient moins performants et plus chers que leurs versions actuelles. Par exemple, GPT-4 coûte alors 30 $/60 $ par million de tokens entrée/sortie.

Voici une liste des prix récents pour certains des LLM les plus performants en août 2024 :

  • La dernière version de GPT-4o coûte 2,50$ / 10$ par million de tokens entrée/sortie. Il s’agit d’une réduction très conséquente par rapport au prix précédent de 5$ / 15$ par million de tokens entrée/sortie.
  • GPT-4o mini, récemment mis sur le marché et qui occupe la troisième place du classement des LLM les plus performants, coûte lui encore beaucoup moins cher, à savoir 0,15$ / 0,075$ par million de tokens entrée/sortie, avec la même réduction de 50% pour le traitement par lots que celle mise en place pour son grand frère.
  • Proposé en open source (et donc pas commercialisé directement) Llama 3.1 405B de Meta, sorti en juillet, est disponible pour 2,70$ / 2,70$ par million de tokens entrée/sortie ( DeepInfra). C’est environ 66% de moins que via Azure.
  • Gemini 1.5 Flass coûte 0,15$ / 0,60$ par million de tokens entrée/sortie après sa dernière baisse de prix. Une réduction de 50% est accordée pour les entrées et les sorties inférieures à 128 000 tokens (ou soumises en mode batch). Il existe également un plan gratuit généreux.
  • Moins connu du grand public, DeepSeek v2 coûte 0,14$ / 0,28$ par million de tokens entrée/sortie. C’est 46% de moins que lorsque le modèle a été publié… fin juillet.

La concurrence est féroce pour fournir entre les géants et les start-up financées par les géants pour sortir les LLM (et autres IA) les plus efficaces et les plus efficients, offrant une gamme conséquente de prix nivelés par le bas, et de performances toujours plus importantes.

Point noir : cette guerre des prix n’est pas tenable pour les petites entreprises, alors même que les coûts de développement et de fonctionnement explosent (au même rythme que la valeur boursière de Nvidia).

OpenAI devrait avoir 8 à 9 milliards de dollars de frais de fonctionnement cette année, et serait dans l’obligation de procéder à une nouvelle levée de fonds massive pour éviter la banqueroute à court terme. Alors même que la start-up cofondée par Elon Musk est l’instigateur de la vague IA et est depuis lors la locomotive de ce succès.