__


Quelques semaines après le New York Times, deux auteurs engagent une nouvelle action en justice contre le duo derrière ChatGPT, OpenAI et Microsoft.

Un nouveau procès (de plus) contre Microsoft et OpenAI

Il y a quelques semaines, l’annonce avait fait grand bruit : le mythique New York Times engage une action en justice contre OpenAI et Microsoft.

Le média américain reproche à l’éditeur de ChatGPT d’avoir formé ses grands modèles de langage (GPT-3.5 et GPT-4, mais aussi les précédents) sur « des millions de ses articles ». Et d’avoir, ce faisant, outrepassé les limites d’utilisation standards et ainsi violé les différentes lois sur les droits d’auteur.

Les données de formation des LLM sont massives, et composées de corpus de millions de textes. Si certaines de ces données sont parfois publiques, comme Wikipédia, d’autres ne le sont pas, loin de là. Mais les sociétés comme OpenAI font valoir la notion de « fair use », ou usage équitable : Si un humain voulait lire le contenu entier d’internet avant de s’en servir pour produire ses propres articles, il en aurait le droit. Et un algorithme devrait en avoir le droit dans les mêmes conditions.

Deux auteurs américains engagent la bataille

Nouvel épisode dans cette future (longue) guerre des droits d’auteur entre les petits éditeurs et les géants de la technologie : vendredi 5 janvier 2024, une procédure a été engagée devant le tribunal fédéral de Manhattan par deux auteurs « qui affirment que les sociétés ont abusé de leur travail », rapporte Reuters.

Les écrits des deux auteurs, Nicholas Basbanes et Nicholas Gage, auraient été directement utilisés pour former les modèles d’IA derrière le chatbot ChatGPT, mais aussi « d’autres services basés sur l’IA ». On pense bien sûr à Copilot de Microsoft, une sorte de spin-off maison de GPT-4.

Les deux hommes parlent dans leur recours collectif de « plusieurs de leurs livres » utilisées dans les données de formation.

D’après The Information, OpenAI négocie actuellement avec plusieurs médias et éditeurs américains pour utiliser leurs données actuelles et à venir légalement. La start-up de Sam Altman a annoncé il y a quelques semaines avec le groupe Axel Springer, et avait fait une annonce similaire avec l’agence Associated Press plus tôt dans l’année.

Mais les sommes avancées par The Information sont de 1 à 5 millions de dollars annuels proposés par OpenAI, une somme jugée « ridicule ». Dans le même temps, alors que OpenAI voit ses revenus s’envoler, un procès pourrait rapporter gros aux plaignants.