Catégories:
Tendances et perspectives du secteur de l’IA
Publié le:
4/19/2025 1:45:00 PM

Le dilemme numérique du droit d'auteur : les frontières juridiques et éthiques de l'IA générative

À l'ère du développement rapide de l'intelligence artificielle, l'IA générative, avec ses capacités de création stupéfiantes, balaie le monde, du texte aux images en passant par la musique et la vidéo. L'IA semble toute-puissante. Cependant, tout en s'émerveillant des avancées technologiques, une question fondamentale devient de plus en plus importante : les problèmes de droits d'auteur liés à ces systèmes d'IA pendant le processus de création. Lorsque les frontières de la « création » par les machines s'estompent, le cadre juridique traditionnel du droit d'auteur est confronté à des défis sans précédent. Cet article explorera en profondeur le dilemme du droit d'auteur posé par l'IA générative, analysera les cas existants et les développements juridiques et réfléchira aux voies de résolution possibles.

Données d'entraînement : le point de départ des litiges en matière de droit d'auteur

Les capacités de l'IA générative proviennent de ses données d'entraînement. Qu'il s'agisse de GPT, DALL-E, Midjourney ou Stable Diffusion, ces modèles maîtrisent les techniques de création en apprenant d'énormes quantités d'œuvres créées par l'homme. Cependant, ce processus de formation de base soulève à lui seul le premier casse-tête en matière de droit d'auteur.

Acquisition de données et controverse sur « l'utilisation équitable »

Les données d'entraînement des grands modèles linguistiques d'OpenAI, d'Anthropic et d'autres sociétés contiennent une grande quantité de texte en ligne, dont une bonne partie est protégée par le droit d'auteur. Selon une enquête du New York Times, les données d'entraînement d'OpenAI contiennent plus de 11 000 livres, y compris des best-sellers non autorisés. Cela a conduit à plusieurs poursuites importantes :

  • En décembre 2023, le New York Times a poursuivi OpenAI et Microsoft, les accusant d'avoir utilisé des millions d'articles de presse protégés par le droit d'auteur sans autorisation pour entraîner ChatGPT.
  • L'écrivain George Martin (auteur de Game of Thrones) et 17 autres écrivains célèbres ont collectivement poursuivi OpenAI pour violation du droit d'auteur.
  • Getty Images a poursuivi Stability AI (le développeur de Stable Diffusion), l'accusant d'avoir récupéré des millions de photos Getty sans autorisation pour l'entraînement.

Le point de controverse central dans ces affaires est le suivant : les sociétés d'IA soutiennent que leur utilisation des données relève de la doctrine de « l'utilisation équitable » (Fair Use) en vertu du droit d'auteur américain, car :

  1. Elles ne copient ni n'affichent directement le contenu original.
  2. Le modèle extrait des données des schémas plutôt que du contenu spécifique.
  3. Cette utilisation a une « nature transformatrice » et sert un objectif différent.

Cependant, les créateurs de contenu soutiennent que :

  1. Les sociétés commerciales utilisent à grande échelle du contenu protégé par le droit d'auteur sans autorisation pour en tirer profit.
  2. Les produits d'IA sont directement en concurrence sur le marché avec les auteurs originaux.
  3. Aucun mécanisme de compensation n'est fourni.

La décision préliminaire du tribunal de district sud de New York en 2023 dans l'affaire « Andersen v. Stability AI » peut être instructive. Le juge a estimé qu'il n'était pas suffisant d'invoquer l'utilisation équitable simplement parce qu'elle était utilisée pour entraîner l'IA et qu'il était nécessaire d'analyser la situation spécifique.

Exceptions à l'exploration de données dans l'UE et différences mondiales

Contrairement aux États-Unis, l'UE prévoit explicitement une « exception pour l'exploration de textes et de données » dans le droit d'auteur. Les articles 3 et 4 de la directive sur le marché unique numérique autorisent les organisations de recherche et autres entités à effectuer l'exploration de textes et de données, mais l'article 4 confère également aux détenteurs de droits le droit de « se retirer ».

Le droit d'auteur japonais est plus ouvert, autorisant explicitement l'utilisation de contenu protégé par le droit d'auteur à des fins d'analyse de données, ce qui fait du Japon un environnement favorable à la recherche sur l'IA.

Cette incohérence du cadre juridique mondial conduit à un phénomène d'« arbitrage juridique » dans le développement de l'IA, les entreprises pouvant choisir de former des modèles dans des régions où l'environnement juridique est plus souple.

Contenu généré par l'IA : qui est le créateur ?

Une autre question centrale est la suivante : à qui devrait appartenir le contenu généré par l'IA ? Peut-il être protégé par le droit d'auteur ?

Différentes positions des organismes de droit d'auteur mondiaux

En 2023, le Bureau américain du droit d'auteur a refusé d'accorder la protection du droit d'auteur à l'image générée par Midjourney « Teatro D'opera Spatial » et a précisé dans la déclaration de politique « Intelligence artificielle et droit d'auteur » : « Le principe de l'auteur humain est la pierre angulaire de la protection du droit d'auteur, et le droit d'auteur américain ne protège que les œuvres intellectuelles humaines. » Cependant, le Bureau du droit d'auteur a également indiqué que les œuvres dans lesquelles les humains coopèrent avec l'IA peuvent être protégées dans la mesure de la contribution créative humaine.

L'Office de la propriété intellectuelle du Royaume-Uni a adopté une position plus souple. Selon son guide Droit d'auteur et œuvres générées par l'IA, les œuvres générées par l'IA peuvent être protégées par le droit d'auteur, mais « l'auteur » sera considéré comme « la personne qui prend des dispositions pour que l'œuvre soit créée ».

La loi sur le droit d'auteur modifiée en 2020 en Chine n'exclut pas non plus explicitement la création d'IA, ce qui offre dans une certaine mesure un espace pour la protection du droit d'auteur du contenu généré par l'IA.

Les leçons tirées d'affaires emblématiques

En 2022, l'écrivain américain Charles Bazán a tenté d'enregistrer le droit d'auteur du roman Zarya of the Dawn, qui contenait des illustrations générées par Midjourney. Le Bureau du droit d'auteur a finalement accordé le droit d'auteur uniquement pour la partie textuelle et a refusé la partie image.

Plus controversé encore, GitHub Copilot de Microsoft et OpenAI fait l'objet d'un recours collectif en raison de la possibilité que le code généré contienne des extraits de code original provenant des données d'entraînement. Ce phénomène de « mémoire » a soulevé des inquiétudes quant à la possibilité que les systèmes d'IA copient directement le contenu original.

Similitude des œuvres : la zone grise entre l'inspiration et le plagiat

Un autre problème soulevé par l'IA générative est le suivant : lorsque le contenu généré par l'IA est similaire aux œuvres existantes, comment déterminer s'il constitue une violation ?

« Imitation de style » et frontières du droit d'auteur

La controverse la plus typique vient du domaine de la génération d'images. Les utilisateurs peuvent demander à l'IA de « créer dans le style de Van Gogh » ou « comme un dessin animé de Disney », ce qui soulève des inquiétudes quant au plagiat de style. En 2023, plusieurs artistes, dont Kelly McKenzie et Greg Rutkowski, ont intenté une action en justice, accusant Stability AI et Midjourney de violer leur style artistique.

Cependant, le droit d'auteur traditionnel ne protège pas le style, la technique ou les idées, mais seulement l'expression spécifique. Ce principe est mis à l'épreuve à l'ère de l'IA, car l'IA peut systématiquement apprendre et imiter les caractéristiques stylistiques des artistes.

Suppression des éléments originaux des données d'entraînement

Certaines sociétés d'IA tentent d'atténuer les risques liés au droit d'auteur par des moyens techniques :

  • OpenAI a ajouté des filtres à DALL-E 3, refusant de générer des demandes imitant le style d'un artiste spécifique.
  • Le modèle Claude d'Anthropic refusera de répéter le contenu complet protégé par le droit d'auteur.
  • Midjourney interdit explicitement aux utilisateurs d'entrer certains noms d'artistes célèbres comme invites.

Cependant, des études montrent que l'efficacité de ces mesures est limitée. Des chercheurs de l'université de Stanford ont découvert que même sans utiliser directement le nom d'un artiste, l'utilisation de termes descriptifs connexes peut permettre à l'IA de générer des œuvres de style similaire.

Législation et adaptation du marché : la voie à suivre

Face à ces défis, les législateurs, les entreprises et les créateurs du monde entier explorent différentes voies :

Nouvelles tentatives législatives

La Loi sur l'intelligence artificielle de l'UE exige que les fournisseurs d'IA générative divulguent le contenu protégé par le droit d'auteur utilisé dans leur formation et fournissent aux détenteurs de droits un mécanisme de retrait.

Le projet de loi du Sénat américain intitulé Clarifying Lawful Use of Our Precious Intellectual Property Act (CLUE Act) tente de clarifier si la formation à l'IA constitue une utilisation équitable, mais il n'a pas encore été adopté à ce jour.

Les Lignes directrices sur le renforcement de la protection du droit d'auteur du contenu généré par l'intelligence artificielle publiées par l'Administration nationale du droit d'auteur de Chine en 2023 proposent que le contenu généré par l'intelligence artificielle puisse être protégé par le droit d'auteur s'il est original et exprimé de manière créative par une personne physique.

Modèles de licence et de compensation

Certaines entreprises ont commencé à explorer des modèles de licence :

  • Associated Press a conclu un accord avec OpenAI, autorisant cette dernière à utiliser ses archives de presse.
  • Shutterstock a établi une coopération avec OpenAI et Stability AI, autorisant l'utilisation de sa photothèque pour former l'IA et créant un fonds de compensation.
  • Adobe Stock a créé un programme de licence « compatible avec l'IA générative » qui autorise explicitement l'utilisation d'une partie du contenu pour la formation à l'IA.

Ces arrangements représentent une solution de marché possible : en assurant une compensation aux créateurs originaux grâce à des accords de licence directe.

Solutions techniques

La chaîne de blocs et les filigranes numériques ont également été proposés comme outils pour résoudre les problèmes de droit d'auteur :

  • La norme d'authentification de contenu développée par la C2PA (Coalition for Content Provenance and Authenticity) permet d'identifier le contenu généré par l'IA.
  • Midjourney et DALL-E intègrent des métadonnées dans les images générées, indiquant leur source d'IA.
  • Certaines jeunes entreprises ont développé des outils capables de distinguer le contenu généré par l'IA de la création humaine.

Équilibre multilatéral : repenser les intérêts de toutes les parties

La résolution des problèmes de droit d'auteur de l'IA générative nécessite de trouver un équilibre entre de nombreuses parties prenantes :

Droits et intérêts raisonnables des créateurs de contenu

Les auteurs originaux méritent d'être protégés et indemnisés. Le syndicat des acteurs SAG-AFTRA a fait des restrictions d'utilisation de l'IA l'une des principales revendications de sa grève de 2023. L'accord final exige que les producteurs obtiennent le consentement et offrent une compensation avant d'utiliser l'IA pour reproduire l'image d'un acteur.

De même, l'industrie musicale explore activement les mécanismes de protection. Le PDG d'Universal Music Group, Lucian Grainge, a déclaré en 2023 : « L'IA peut être un outil pour les artistes, mais pas un substitut. »

Développement technologique et intérêt public

Dans le même temps, des restrictions trop strictes peuvent entraver le progrès technologique et l'intérêt social. Les chercheurs en IA soulignent que si chaque donnée d'entraînement nécessitait une autorisation distincte, le coût du développement du modèle serait prohibitif et limiterait l'innovation.

Un plan d'équilibre potentiel consiste à établir un système de licence légale, semblable au système de licence mécanique de l'industrie musicale, qui permettrait d'utiliser le contenu protégé mais exigerait le paiement de frais raisonnables.

Conclusion : vers un avenir de symbiose

Les défis liés au droit d'auteur posés par l'IA générative n'ont pas de solution simple. Le rythme du développement technologique dépasse de loin le rythme des ajustements juridiques, et cet écart doit être comblé par les efforts conjoints de toutes les parties.

L'évolution la plus probable à l'avenir est la suivante : amélioration progressive du cadre juridique, innovation des modèles de licence commerciale, soutien des outils technologiques et dialogue et coopération plus approfondis entre toutes les parties prenantes. Au cours de ce processus, nous devons à la fois protéger les droits et intérêts légitimes des créateurs et fournir un espace pour l'innovation technologique, afin d'établir en fin de compte un écosystème dans lequel l'IA et la créativité humaine coexistent.

Tout comme l'objectif fondamental du droit d'auteur est de promouvoir le développement des connaissances et de la culture, face aux défis de l'ère de l'IA, nous devons revenir à ce concept central et rechercher un point d'équilibre qui puisse à la fois encourager la créativité humaine et l'innovation technologique. Il ne s'agit pas seulement d'une question juridique, mais aussi d'une réflexion approfondie sur la manière dont nous définissons la créativité elle-même et sur la manière dont les humains et les machines devraient coexister dans cette nouvelle ère.

Lecture recommandée: