Reddit demanda a Perplexity por extraer datos: claves del caso

  • Reddit presentó una demanda en Nueva York contra Perplexity y tres empresas por la supuesta extracción no autorizada de datos.
  • Perplexity niega las acusaciones y defiende el acceso justo al conocimiento público; SerpApi y Oxylabs también rechazan los cargos.
  • La plataforma ya licencia contenido a Google y OpenAI; envió un requerimiento previo y cita un aumento x40 en referencias a Reddit.
  • El caso roza Europa por la lituana Oxylabs y reaviva el debate sobre scraping y derechos en el marco regulatorio de la UE.

Demanda de Reddit a Perplexity por extracción de datos

La red social con sede en San Francisco ha interpuesto una demanda federal en Nueva York contra Perplexity AI y varias firmas vinculadas a la recolección de información en la web, alegando que han obtenido contenido de Reddit sin permiso para alimentar herramientas basadas en inteligencia artificial.

Según el escrito, Perplexity no contaría con licencia para utilizar el material de la plataforma, mientras que Reddit sí ha llegado a acuerdos con otras tecnológicas como Google y OpenAI; además, tras un requerimiento de cese y desistimiento remitido el año pasado, la compañía asegura que las menciones a Reddit en el sistema de Perplexity se multiplicaron por cuarenta.

Qué se denuncia

Reddit sostiene que distintos servicios de scraping habrían eludido medidas anti-extracción de la plataforma y recabado publicaciones a través de resultados del buscador de Google, describiendo la práctica como una “economía de blanqueo de datos” a escala industrial.

En la demanda se detalla que Perplexity habría recurrido al menos a uno de estos proveedores para obtener contenido de Reddit, en lugar de suscribir una licencia con la propia plataforma, y que los extractores habrían enmascarado identidades y ubicaciones para sortear los controles.

Quiénes son los implicados

Además de Perplexity, el litigio señala a Oxylabs UAB (Lituania), al dominio AWMProxy (que Reddit describe como vinculado a un antiguo botnet ruso) y a la startup SerpApi (Texas), lo que sitúa el caso en un mapa que mezcla actores de Estados Unidos y Europa.

La respuesta de las empresas demandadas

Perplexity ha afirmado que aún no ha sido formalmente notificada y que defenderá con firmeza el derecho de los usuarios a acceder de forma libre y justa al conocimiento público, resaltando que su enfoque pretende ofrecer respuestas precisas con IA de manera responsable.

Desde SerpApi, un portavoz ha rechazado por completo las acusaciones y ha avanzado que la compañía se defenderá enérgicamente ante los tribunales; Oxylabs, por su parte, se mostró sorprendida y decepcionada, asegurando que no recibió un contacto previo de Reddit y defendiendo la recopilación de datos públicos.

En cuanto a AWMProxy, la plataforma indica que no ha sido posible recabar comentarios de la entidad.

Antecedentes y acuerdos de licencia

Este paso legal se suma a otro frente abierto por Reddit: en junio presentó una demanda similar contra la compañía de IA Anthropic, un procedimiento que permanece en curso tras su traslado a un tribunal federal.

Reddit recalca que su comunidad, compuesta por miles de subreddits y más de 100 millones de usuarios diarios, es una fuente clave de conversaciones en internet, razón por la que ha firmado licencias con Google, OpenAI y otras firmas para el entrenamiento de modelos.

En el plano bursátil, tras conocerse la acción judicial las acciones de Reddit cerraron la sesión con una caída superior al 4% en Nueva York, reflejando la sensibilidad del mercado a las disputas por datos en el sector de la IA.

Implicaciones para Europa y España

La presencia de Oxylabs, con sede en la Unión Europea, introduce un ángulo europeo en la controversia y vuelve a poner sobre la mesa el debate sobre el uso de datos públicos, el scraping y los límites del copyright bajo la normativa comunitaria.

Más allá del litigio en EE. UU., actores europeos —incluidos editores, plataformas y desarrolladores— siguen muy atentos a cómo se equilibra el acceso a información disponible públicamente con la protección de derechos y las condiciones de uso, en un contexto marcado por la Directiva de Derechos de Autor y el marco regulatorio emergente para la IA.

Qué pide Reddit y próximos pasos

La compañía solicita una indemnización económica no especificada y una orden judicial que impida a Perplexity utilizar datos de Reddit, a la espera de que el tribunal determine si hubo vulneración de derechos y qué alcance tendrían eventuales medidas cautelares.

Quedan por definir los tiempos procesales y el encaje de las defensas, pero todo apunta a que este caso marcará jurisprudencia en un terreno donde colisionan el interés público por la información, la propiedad intelectual y las necesidades de entrenamiento de los sistemas de IA.

El pulso entre plataformas con grandes repositorios de conversación humana y empresas de inteligencia artificial se intensifica: con licencias en un lado y alegaciones de scraping en otro, la disputa entre Reddit y Perplexity ilustra el nuevo tablero en el que se negocian valor, permisos y límites de los datos online.

cómo comprar desde ChatGPT-2
Artículo relacionado:
Comprar desde ChatGPT: guía completa para aprovechar la IA en tus compras online