Reddit restreint l’accès de la Wayback Machine pour protéger ses données face à l’IA

Par Charlotte Pierre

12 août 2025

jupdlc-reddit-way-back-machine
jupdlc-reddit-way-back-machine

Le 11 août 2025, Reddit a annoncé qu’il limiterait désormais l’accès de la Wayback Machine, l’outil d’archivage d’Internet Archive, à sa seule page d’accueil. Objectif : protéger la vie privée de ses utilisateurs, empêcher que des entreprises d’IA ne piochent gratuitement dans ses données et renforcer la monétisation de ses contenus.

jupdlc-reddit-wayback-machine (1)
Crédit photo : Pexels / Brett Jordan

Une fermeture à la plus grande bibliothèque du web

Reddit a annoncé qu’il allait considérablement limiter l’accès d’Internet Archive (une organisation à but non lucratif visant à archiver le web, telle une bibliothèque numérique), et plus particulièrement de sa Wayback Machine, à ses contenus. Désormais, seule la page d’accueil de Reddit pourra être archivée. Les pages de détails des publications, les commentaires, les profils et les subreddits ne seront plus accessibles à l’archivage.

Officiellement, cette décision vise à protéger la vie privée des utilisateurs et à empêcher que des entreprises d’intelligence artificielle n’exploitent ces archives pour entraîner leurs modèles sans payer de licence. Selon Tim Rathschmidt, porte-parole de Reddit, certaines sociétés contourneraient les conditions d’utilisation de la plateforme en passant par la Wayback Machine pour extraire des messages, commentaires, et même des contenus supprimés, ce qui nuirait à la capacité de Reddit de gérer et protéger ses données.

jupdlc-reddit-way-back-machine
Crédit photo : Adobe Stock / GoodPics

Un changement de stratégie

Ce changement marque un revirement par rapport à la position affichée en 2024, lorsque Reddit garantissait que les « acteurs de bonne foi » comme Internet Archive ne seraient pas affectés par ses mesures anti-scraping.

Mais depuis, la monétisation des données est devenue un pilier stratégique : selon sa COO Jen Wong, interrogée par ADWEEK, les licences liées à l’IA représenteraient déjà une part à deux chiffres du chiffre d’affaires, à côté des revenus publicitaires. Reddit a notamment signé des accords de plusieurs millions de dollars avec Google et OpenAI l’an dernier, et a intenté un procès à Anthropic pour usage non autorisé de ses données.

L’objectif ? Trouver un équilibre entre protection de la vie privée des utilisateurs, sécurité de la plateforme et intérêts commerciaux, en régulant l’accès des tiers à son vaste contenu.


À découvrir sur JUPDLC



Les données communautaires : une mine d’or monétisable

Au-delà de Reddit, cette décision illustre une tension croissante entre préservation numérique et sécurité des données à l’ère de l’IA générative. Les archives ouvertes comme la Wayback Machine, historiquement utilisées pour conserver la mémoire du web, deviennent aussi des cibles pour les bots d’IA. Cela pose une question : si les plateformes limitent de plus en plus les archives externes, faudra-t-il se reposer uniquement sur elles pour conserver leurs propres contenus ? Un risque pour la mémoire collective… Et pour tous ceux qui exploitent l’historique des conversations en ligne à des fins de veille, d’analyse ou de storytelling.

jupdlc-reddit-wayback-machine
Crédit photo : Adobe Stock / tramp51

Cette décision révèle combien conversations et contenus générés par les communautés en ligne sont traités comme un capital commercial à forte valeur ajoutée : protégés, monétisés et moins accessibles gratuitement. Or, pour les acteurs de la veille et du marketing, cela signifie, aussi, moins d’accès libre aux archives, la nécessité d’adapter les méthodes de suivi et, souvent, de passer par des partenariats ou des outils payants, privilégiant le second party data au third party data. De quoi rappeler, enfin, que la protection et la gestion des données représentent un levier direct d’image, de compétitivité et de monétisation pour les plateformes.

ÉVÉNEMENT

Morning Talk

Bataille de l'attention – comment capter, retenir et convertir ?

24 mars 2026 8h30 - 11h Paris
Je réserve ma place
Le meilleur de la communication, du marketing et de la créativité chaque semaine dans votre inbox !
Nous n'avons pas pu confirmer votre inscription.
Votre inscription est confirmée.

Nous utilisons Brevo en tant que plateforme marketing. En soumettant ce formulaire, vous acceptez que les données personnelles que vous avez fournies soient transférées à Brevo pour être traitées conformément à la politique de confidentialité de Brevo.