La pétition des 500 auteurs contre l'entraînement IA, ce qu'elle dit vraiment (et ce qu'elle ne dit pas)
J'ai pris le temps de lire le texte intégral de la pétition lancée la semaine dernière par Slimani, Dicker et une centaine d'autres. Beaucoup de papiers ont titré dessus en simplifiant, donc quelques précisions.
D'abord, ce n'est pas une demande d'interdiction. C'est une demande de cadre d'autorisation préalable, ce qui est très différent. Concrètement les signataires veulent pouvoir refuser que leurs livres soient inclus dans un dataset d'entraînement, et obtenir une rémunération s'ils acceptent. C'est exactement le modèle qui existe déjà pour la reproduction et l'adaptation audiovisuelle.
Ensuite, le texte est juridiquement très bien construit (l'avocat de la SGDL a clairement mis la main dessus). Il s'appuie sur l'article L122-5 du code de la propriété intellectuelle et sur l'arrêt CJUE Pelham GmbH de 2019. Ce n'est pas une tribune émotionnelle, c'est une mise en demeure habillée.
Ce qui me semble plus discutable, c'est la stratégie. Demander un opt-in préalable revient à interdire de fait l'entraînement sur le corpus français, parce qu'aucun éditeur n'aura les moyens administratifs de gérer 500 000 demandes. À mon sens c'est exactement ce que les signataires veulent, mais ils ne le disent pas frontalement.
Donc à terme : soit Mistral entraîne ses modèles sur du corpus anglais et on perd la souveraineté linguistique, soit l'État finance une licence collective et on rentre dans une logique de redevance type SACEM. Les deux scénarios ont leurs problèmes, et personne ne semble les avoir vraiment posés.
3
3 commentaires