__


MathGPT : Un GPT sud-coréen dédié à la résolution de problèmes mathématiques bat les géants du marché de Microsoft et d’OpenAI.

Des GPT partout

Fin novembre 2022, OpenAI popularisait l’appellation « GPT » en lançant ChatGPT, son chabot boosté à l’intelligence artificielle. ChatGPT est d’ailleurs la contraction même de « Chat » et « GPT », l’acronyme de Generative pretrained transformers (voir notre dossier « ChatGPT, c’est quoi » à ce lien).

Le chatbot d’OpenAI était basé sur le modèle GPT-3.5, et voyait quelques mois plus tard un modèle beaucoup plus performant lui succéder (pour les versions payantes seulement) : GPT-4.

Et depuis, soit il y a bientôt un an, GPT-4 reste le modèle de référence sur le marché, et sert de mètre-étalon aux autres modèles et concurrents, comme l’a montré le récent lancement de Gemini par Google.

On a aussi découvert récemment un projet « ScienceGPT », qui devrait mettre l’accent non pas sur les contenus pillés, volés et régurgités, mais sur des publications scientifiques.

Aujourd’hui, c’est un autre GPT qui fait parler : MathGPT !

MathGPT bat tous les records

On l’a oublié, mais ChatGPT a été pendant des mois extrêmement mauvais en math, au point que c’en était un point décrédibilisant pour une technologie par ailleurs impressionnante.

D’ailleurs, encore à l’heure actuelle, GPT-3.5 (la version gratuite) est toujours très mauvaise. Par exemple, le modèle ne sait pas faire une multiplication très simple comme « 1112223 x 222333 » :

La réponse est fausse : ChatGPT ne sait toujours pas faire des multiplications.

Mais les mathématiques sont un domaine très particulier, et dont les ressources nécessaires sont très éloignées des facultés classiques des LLM (large langage model).

Alors une équipe coréenne a mis au point un GPT dédié aux mathématiques, nommé MathGPT. Une IA dédiée aux mathématiques, créée par le groupement sud-coréen KT, Qanda et Upstage. Il faut noter que Qanda est soutenu par des géants comme Google, TikTok et Softbank.

Pour former MathGPT, ses créateurs ont utilisé comme données de formations l’équivalent de 10 millions de problèmes par jour. Des problèmes obtenus via la plateforme Mathpresso de Qanda, qui compte des millions d’utilisateurs actifs chaque mois en Corée du Sud, au Japon, en Thaïlande et au Vietnam.

Par ailleurs :

« Qanda est une plateforme d’apprentissage basée sur l’IA et conçue pour les élèves de la maternelle à la 12e année. Utilisant la technologie avancée de reconnaissance optique de caractères (OCR), l’application reconnaît le texte et les équations mathématiques à partir de photos et propose des solutions approfondies et un contenu d’apprentissage personnalisé. Depuis sa création, QANDA a rassemblé une communauté de plus de 90 millions d’utilisateurs enregistrés dans plus de 50 pays. « 

En plus de ces données mathématiques, Upstage s’est chargé de la partie LLM, et le géant des telco’ KT chapeautait le projet.

Et le résultat est déjà record :

« MathGPT a dépassé le modèle « ToRA 13B » de Microsoft, le précédent détenteur du record dans les tests d’évaluation des performances mathématiques tels que « MATH » (mathématiques au lycée) et « GSM8K » (mathématiques à l’école primaire), en obtenant la première place parmi les modèles inférieurs à 13B – un exploit rare pour prendre la première place dans les deux tests. MathGPT a surpassé GPT-4 dans l’évaluation MATH. »

Et pourtant, le projet est très récent : il a été initié en novembre 2023, soit il y a à peine deux mois !

Alors, pourra-t-on bientôt devoir arrêter de vérifier chaque calcul réalisé par ChatGPT grâce aux percées prouvées des GPT dans le domaine des mathématiques ?