Le 24 juin 2025, le juge William Alsup (District Nord de Californie) a rendu une décision très attendue dans l’affaire Bartz v. Anthropic. Il y reconnaît que l’entraînement d’un modèle d’intelligence artificielle sur des livres légalement acquis peut relever du fair use, en tant qu’usage « transformateur » au sens du droit américain (c’est-à-dire que le résultat final (l’IA) ne reproduit pas directement les œuvres originales). Mais il constate également que l’utilisation de livres piratés constitue une violation manifeste du droit d’auteur, ouvrant la voie à une procédure contentieuse distincte.
Cette décision éclaire la ligne de crête sur laquelle évoluent les technologies d’IA générative : entre droit d’apprendre et reproduction illicite.
Le critère central : la licéité de la source.
L’analyse du juge repose sur une distinction nette :
- L’entraînement sur des livres achetés (notamment via des plateformes commerciales ou dans des bibliothèques physiques) constitue, selon lui, un usage transformateur. L’IA ne restitue pas les passages, mais s’en inspire pour produire des contenus nouveaux. Le but de cet usage diffère de celui de la création initiale, ce qui permet de l’analyser comme fair use, dans la lignée des jurisprudences Google Books et HathiTrust.
- L’utilisation de livres piratés (issus notamment de bases comme LibGen ou Pirate Library Mirror) est en revanche considérée comme une reproduction illicite, non susceptible de justification. Le juge renvoie cette partie du litige à une procédure sur le fond, pour évaluer les dommages.
Cette double approche constitue un jalon en matière d’entraînement des IA, mais elle ne peut être transposée mécaniquement au droit français ou européen.
Qu’en est-il en droit européen, et plus encore en musique ?
Le droit de l’Union européenne encadre de façon précise l’analyse automatisée de contenus protégés, ce qu’on appelle le text and data mining (TDM), c’est-à-dire l’exploration de textes ou de données par des algorithmes.
La directive 2019/790 (dite directive DSM), transposée en droit français, prévoit deux exceptions à cette règle :
- L’article 3 autorise le TDM à des fins de recherche scientifique, mais uniquement pour les organismes à but non lucratif (comme les universités ou les centres de recherche publics).
- L’article 4 permet un TDM plus large pour d’autres usages (y compris commerciaux), mais seulement si les titulaires de droits ne s’y sont pas opposés. Cette opposition peut être exprimée par une simple mention visible ou une indication technique — c’est ce qu’on appelle la clause d’opt-out.
Cependant, plusieurs limitations rendent ces exceptions difficilement applicables à l’entraînement d’IA commerciales, en particulier dans le domaine musical :
- L’opposition peut être exprimée par simple mention dans les métadonnées, ce qui limite la sécurité juridique des utilisateurs.
- Les exceptions ne couvrent pas les finalités commerciales quand une opposition est formulée.
- Les droits voisins des artistes-interprètes et producteurs de phonogrammes doivent également être respectés. Or, aucune exception équivalente ne leur est ouverte.
En conséquence, une IA musicale entraînée sur des enregistrements du commerce, sans autorisation des titulaires des droits d’auteur et voisins, s’exposerait à un risque juridique important.
Une jurisprudence encore absente en matière musicale
À ce jour, aucune décision de justice, ni aux États-Unis ni en Europe, n’a encore tranché la légalité de l’entraînement d’un modèle d’IA générative à partir d’un corpus musical protégé.
Le secteur de la musique est pourtant exposé à ces enjeux, tant les modèles génératifs (capables de produire des chansons, des voix ou des styles musicaux) nécessitent des corpus d’apprentissage vastes et représentatifs. L’absence de contentieux ne signifie pas pour autant que la pratique soit licite : elle peut simplement relever d’un vide stratégique ou d’une phase de négociation encore informelle.
Une exigence croissante de transparence
La décision Anthropic envoie un message clair à l’industrie : la provenance des données d’entraînement est désormais une variable juridique déterminante. Cela implique :
- une nécessaire traçabilité des corpus utilisés,
- la déclaration des sources d’entraînement, comme condition de licéité ou de licéité présumée,
- l’ouverture de discussions contractuelles avec les sociétés d’auteurs, les éditeurs et les producteurs, pour encadrer contractuellement les usages.
En musique, dans ce contexte, les discussions à venir pourraient porter sur la mise en place de licences spécifiques encadrant l’entraînement d’IA sur des œuvres musicales, à l’initiative des sociétés de gestion collective ou des ayants droit eux-mêmes.
***
La jurisprudence Anthropic ouvre une voie à l’encadrement juridique de l’entraînement des IA sur des contenus textuels, dès lors que les œuvres sont acquises légalement. Elle ne saurait toutefois être étendue au domaine musical sans précautions, compte tenu de la pluralité des titulaires de droits et de l’absence d’exception équivalente au fair use en droit d’auteur.
Dans ce contexte, le recours à des bases musicales licites et à des modèles de licence négociés apparaît comme une nécessité pour toute IA musicale désireuse de se développer dans le respect des cadres juridiques existants.