La red social con sede en San Francisco ha interpuesto una demanda federal en Nueva York contra Perplexity AI y varias firmas vinculadas a la recolección de información en la web, alegando que han obtenido contenido de Reddit sin permiso para alimentar herramientas basadas en inteligencia artificial.
Según el escrito, Perplexity no contaría con licencia para utilizar el material de la plataforma, mientras que Reddit sí ha llegado a acuerdos con otras tecnológicas como Google y OpenAI; además, tras un requerimiento de cese y desistimiento remitido el año pasado, la compañía asegura que las menciones a Reddit en el sistema de Perplexity se multiplicaron por cuarenta.
Qué se denuncia
Reddit sostiene que distintos servicios de scraping habrían eludido medidas anti-extracción de la plataforma y recabado publicaciones a través de resultados del buscador de Google, describiendo la práctica como una “economía de blanqueo de datos” a escala industrial.
En la demanda se detalla que Perplexity habría recurrido al menos a uno de estos proveedores para obtener contenido de Reddit, en lugar de suscribir una licencia con la propia plataforma, y que los extractores habrían enmascarado identidades y ubicaciones para sortear los controles.
Quiénes son los implicados
Además de Perplexity, el litigio señala a Oxylabs UAB (Lituania), al dominio AWMProxy (que Reddit describe como vinculado a un antiguo botnet ruso) y a la startup SerpApi (Texas), lo que sitúa el caso en un mapa que mezcla actores de Estados Unidos y Europa.
La respuesta de las empresas demandadas
Perplexity ha afirmado que aún no ha sido formalmente notificada y que defenderá con firmeza el derecho de los usuarios a acceder de forma libre y justa al conocimiento público, resaltando que su enfoque pretende ofrecer respuestas precisas con IA de manera responsable.
Desde SerpApi, un portavoz ha rechazado por completo las acusaciones y ha avanzado que la compañía se defenderá enérgicamente ante los tribunales; Oxylabs, por su parte, se mostró sorprendida y decepcionada, asegurando que no recibió un contacto previo de Reddit y defendiendo la recopilación de datos públicos.
En cuanto a AWMProxy, la plataforma indica que no ha sido posible recabar comentarios de la entidad.
Antecedentes y acuerdos de licencia
Este paso legal se suma a otro frente abierto por Reddit: en junio presentó una demanda similar contra la compañía de IA Anthropic, un procedimiento que permanece en curso tras su traslado a un tribunal federal.
Reddit recalca que su comunidad, compuesta por miles de subreddits y más de 100 millones de usuarios diarios, es una fuente clave de conversaciones en internet, razón por la que ha firmado licencias con Google, OpenAI y otras firmas para el entrenamiento de modelos.
En el plano bursátil, tras conocerse la acción judicial las acciones de Reddit cerraron la sesión con una caída superior al 4% en Nueva York, reflejando la sensibilidad del mercado a las disputas por datos en el sector de la IA.
Implicaciones para Europa y España
La presencia de Oxylabs, con sede en la Unión Europea, introduce un ángulo europeo en la controversia y vuelve a poner sobre la mesa el debate sobre el uso de datos públicos, el scraping y los límites del copyright bajo la normativa comunitaria.
Más allá del litigio en EE. UU., actores europeos —incluidos editores, plataformas y desarrolladores— siguen muy atentos a cómo se equilibra el acceso a información disponible públicamente con la protección de derechos y las condiciones de uso, en un contexto marcado por la Directiva de Derechos de Autor y el marco regulatorio emergente para la IA.
Qué pide Reddit y próximos pasos
La compañía solicita una indemnización económica no especificada y una orden judicial que impida a Perplexity utilizar datos de Reddit, a la espera de que el tribunal determine si hubo vulneración de derechos y qué alcance tendrían eventuales medidas cautelares.
Quedan por definir los tiempos procesales y el encaje de las defensas, pero todo apunta a que este caso marcará jurisprudencia en un terreno donde colisionan el interés público por la información, la propiedad intelectual y las necesidades de entrenamiento de los sistemas de IA.
El pulso entre plataformas con grandes repositorios de conversación humana y empresas de inteligencia artificial se intensifica: con licencias en un lado y alegaciones de scraping en otro, la disputa entre Reddit y Perplexity ilustra el nuevo tablero en el que se negocian valor, permisos y límites de los datos online.