Reddit klaagt Perplexity aan voor datamining: belangrijkste feiten over de zaak

  • Reddit heeft in New York een rechtszaak aangespannen tegen Perplexity en drie bedrijven wegens het naar verluidt onrechtmatig verkrijgen van gegevens.
  • Perplexity ontkent de beschuldigingen en verdedigt eerlijke toegang tot publieke kennis. SerpApi en Oxylabs verwerpen de beschuldigingen eveneens.
  • Het platform heeft al een licentie voor content van Google en OpenAI. Er is een voorlopige kennisgeving ingediend en er wordt melding gemaakt van een 40x toename in doorverwijzingen naar Reddit.
  • De zaak, die het Litouwse bedrijf Oxylabs betreft, heeft Europa geraakt en het debat over scraping en rechten binnen het EU-regelgevingskader nieuw leven ingeblazen.

Reddit klaagt Perplexity aan voor datamining

Het in San Francisco gevestigde sociale netwerk heeft een klacht ingediend federale rechtszaak in New York tegen Perplexity AI en verschillende bedrijven die betrokken zijn bij het verzamelen van webgegevens. De onderzoekers beweren dat ze zonder toestemming Reddit-content hebben verkregen om deze te gebruiken voor AI-tools.

Volgens het document zou Perplexity geen licentie hebben om het materiaal van het platform te gebruiken, terwijl Reddit overeenkomsten heeft gesloten met andere technologiebedrijven zoals Google en OpenAI; bovendien, na een verzoek tot staking en beëindiging Het bedrijf stelde vorig jaar dat het aantal Reddit-vermeldingen in het systeem van Perplexity veertig keer zo hoog was.

Wat wordt gerapporteerd

Reddit beweert dat verschillende scrapingdiensten omzeilde anti-extractiemaatregelen van het platform en verzamelde publicaties via de zoekresultaten van Google, waarbij de praktijk werd omschreven als een ‘data-witwaseconomie’ op industriële schaal.

In de rechtszaak wordt vermeld dat Perplexity minstens één van deze aanbieders zou hebben gebruikt om Reddit-inhoud te verkrijgen, in plaats van abonneren op een licentie met het platform zelf, en dat de extractors hun identiteit en locatie zouden hebben gemaskeerd om de controles te omzeilen.

Wie zijn hierbij betrokken?

Naast Verwarring wijst de rechtszaak op Oxylabs UAB (Litouwen), naar het AWMProxy-domein (dat volgens Reddit is gekoppeld aan een voormalig Russisch botnet) en naar de startup SerpApi (Texas), die de zaak op een kaart zet met een mix van actoren uit de Verenigde Staten en Europa.

Het antwoord van de gedaagde bedrijven

Perplexity heeft verklaard dat het nog niet formeel op de hoogte is gesteld en dat het de rechten van gebruikers op privacy krachtig zal verdedigen. vrije en eerlijke toegang openbaar gemaakt en benadrukt dat de aanpak erop gericht is om op verantwoorde wijze met AI nauwkeurige antwoorden te geven.

Een woordvoerder van SerpApi heeft de beschuldigingen volledig verworpen en heeft gesteld dat het bedrijf zal zich krachtig verdedigen in de rechtbank; Oxylabs uitte op haar beurt haar verbazing en teleurstelling, stelde dat Reddit haar niet eerder had benaderd en verdedigde haar verzameling van openbare gegevens.

Wat AWMProxy betreft, geeft het platform aan dat het niet mogelijk is geweest opmerkingen verzamelen Van de entiteit.

Achtergrond en licentieovereenkomsten

Deze juridische stap is een vervolg op een ander front dat Reddit heeft geopend: in juni spande het een soortgelijke rechtszaak aan tegen het AI-bedrijf Anthropic, een procedure die is nog in uitvoering nadat de zaak was overgedragen aan een federale rechtbank.

Reddit benadrukt dat haar community, bestaande uit duizenden subreddits en meer dan 100 miljoen dagelijkse gebruikersis een belangrijke bron voor internetgesprekken en heeft daarom licenties afgesloten met Google, OpenAI en andere bedrijven voor het trainen van modellen.

Op de aandelenmarkt sloten de aandelen van Reddit, na kennis te hebben genomen van de rechtszaak, de sessie af met een daling van meer dan 4% in New York, wat de gevoeligheid van de markt voor datageschillen in de AI-sector weerspiegelt.

Gevolgen voor Europa en Spanje

De aanwezigheid van Oxylabs, gevestigd in de EU, introduceert een Europese invalshoek voor de controverse en brengt het debat op een hoger plan. gebruik van openbare gegevens, scraping en de grenzen van het auteursrecht onder het EU-recht.

Naast de rechtszaak in de VS blijven Europese spelers – waaronder uitgevers, platforms en ontwikkelaars – nauwlettend in de gaten houden hoe de balans zich ontwikkelt. toegang tot informatie openbaar beschikbaar met bescherming van de rechten en gebruiksvoorwaarden, in een context die wordt gekenmerkt door de auteursrechtrichtlijn en het opkomende regelgevingskader voor AI.

Wat Reddit vraagt ​​en de volgende stappen

Het bedrijf vraagt ​​om een financiële compensatie niet nader gespecificeerd en een bevel dat Perplexity verbiedt Reddit-gegevens te gebruiken, in afwachting van een uitspraak van de rechtbank over de vraag of er rechten zijn geschonden en de reikwijdte van eventuele bevelen.

De procedurele termijnen en de geschiktheid van de verweren moeten nog worden vastgesteld, maar alles wijst op deze zaak zal een precedent scheppen in een veld waar de publieke belangstelling voor informatie, intellectueel eigendom en de trainingsbehoeften van AI-systemen met elkaar botsen.

De strijd tussen platforms met grote opslagplaatsen voor menselijke conversaties en bedrijven die kunstmatige intelligentie gebruiken, wordt steeds heviger: met aan de ene kant de licenties en aan de andere kant de beschuldigingen van het schrapen, is het conflict tussen Reddit en Perplexity illustreert het nieuwe bord waar de waarde, rechten en grenzen van online gegevens worden onderhandeld.

Hoe te kopen bij ChatGPT-2
Gerelateerd artikel:
Kopen bij ChatGPT: een complete gids voor het benutten van AI bij uw online aankopen