{"id":18013,"date":"2023-12-08T17:22:11","date_gmt":"2023-12-08T16:22:11","guid":{"rendered":"https:\/\/www.wieringa-advocaten.nl\/?p=18013"},"modified":"2023-12-08T17:22:11","modified_gmt":"2023-12-08T16:22:11","slug":"scrape-away","status":"publish","type":"post","link":"https:\/\/testt.lexbruinhof.nl\/index.php\/2023\/12\/08\/scrape-away\/","title":{"rendered":"Scrape away!"},"content":{"rendered":"\n<h3 class=\"wp-block-heading\" id=\"h-ai-en-auteursrecht-aflevering-6\">(AI en auteursrecht, aflevering 6)<\/h3>\n\n\n\n<p>Het omvangrijkste verveelvoudigen dat generatieve AI-programma&#8217;s doen, gebeurt in hun leerproces &#8211; dat zagen we aan het slot van de vorige aflevering. Want hoe gaat dat in zijn werk? De programma\u2019s leren door \u201cmachine learning\u201d, wat neerkomt op het verwerken van een enorme hoeveelheid data (tekst, beeld, geluid), waar patronen en structuren in worden herkend. Dat \u201cverwerken\u201d kan plaatsvinden omdat die data (waaronder vele auteursrechtelijk beschermde werken) worden ingevoerd. En dat invoeren brengt met zich mee dat er een verveelvoudiging wordt gemaakt. Het originele werk wordt in de computer gekopieerd. Vervolgens wordt het weliswaar \u201caan stukken gescheurd\u201d ten behoeve van dat &#8220;herkennen van patronen en structuren&#8221;. Maar dat doet niet af aan het feit dat er een \u201ctechnische\u201d verveelvoudiging is gemaakt.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-technisch-verveelvoudigen\"><strong>Technisch verveelvoudigen<\/strong><\/h3>\n\n\n\n<p>Die \u201ctechnische verveelvoudigingen\u201d komen we vaker tegen in het auteursrecht. Het hele internet draait er zo\u2019n beetje op. Voordat een stuk tekst, muziek of (bewegend) beeld het scherm van een internetgebruiker bereikt, zijn daar tal van dergelijke technische verveelvoudigingen van gemaakt, die over het net flitsten op hun reis vanaf de oorspronkelijke server. Die reis wordt bij voorkeur zo kort mogelijk gehouden. Vandaar dat veel van dit materiaal op belangrijke hubs onderweg in <em>caches <\/em>wordt opgeslagen. Al deze \u201ctechnische\u201d verveelvoudigingen zijn <strong>auteursrechtelijk niet relevant<\/strong>; dat hebben we rond het einde van de vorige eeuw zo afgesproken <a id=\"_ftnref1\" href=\"#_ftn1\">[1]<\/a>.  Als neerslag daarvan staat in onze Auteurswet sindsdien <a href=\"https:\/\/wetten.overheid.nl\/jci1.3:c:BWBR0001886&amp;hoofdstuk=I&amp;paragraaf=5&amp;artikel=13a&amp;z=2022-10-01&amp;g=2022-10-01\">artikel 13a<\/a> (en is ons internet niet aan het auteursrecht ten onder gegaan).<\/p>\n\n\n\n<p>We moeten immers niet vergeten dat het in het auteursrecht eerst en vooral gaat om de bescherming van de <em>exploitatiemogelijkheden <\/em>van de maker\/auteursrechthebbende. <em>Die <\/em>mogen hem niet uit handen worden geslagen. Die verveelvoudigingen van enen en nullen die over het internet schieten zijn <em>op zichzelf <\/em>geen vorm van exploitatie, maar alleen een middel om tot exploitatie (het uiteindelijk openbaar maken van het werk) te komen.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-scraping\"><strong>Scraping<\/strong><\/h3>\n\n\n\n<p>Maar\u2026 geldt voor het \u201cleegtrekken\u201d van internet door generatieve AI-programma\u2019s dan in feite niet hetzelfde? Dat leegtrekken, in Amerika bekend als <em>scraping<\/em>, gebeurt immers alleen maar in het kader van het \u201cleerproces\u201d van het programma. Niemand gaat ooit naar die gescrapete bestanden kijken of luisteren. Ge\u00ebxploiteerd wordt er nog niks: dat gebeurt pas als het programma <em>heel veel <\/em>gescrapet (en daardoor geleerd) heeft. En de exploitatie die <em>dan <\/em>plaatsvindt, heeft zo goed als niets meer te maken met de ooit gescrapete werken. Waarom zouden we scraping (of netter Europees uitgedrukt: &#8220;text- and datamining&#8221;) dan niet \u00f3\u00f3k als een technische verveelvoudiging beschouwen?<\/p>\n\n\n\n<p>Welnu: dat doen we sinds 2021 dus ook. Het belang van scraping, in eerste instantie vooral voor analytische en statistische doelen, is door de EU al enkele jaren geleden onderkend. Het is \u00e9\u00e9n van de onderwerpen waarvoor een tweede overkoepelende auteursrechtrichtlijn in het leven is geroepen: de Richtlijn inzake auteursrechten in de digitale eengemaakte markt uit 2019. Beter bekend als de <a href=\"https:\/\/eur-lex.europa.eu\/legal-content\/NL\/TXT\/?uri=celex%3A32019L0790\">DSM (= Digital Single Market)-richtlijn (EU) 2019\/790<\/a>.) Artikel 4 van die DSM-richtlijn verplicht de lidstaten een uitzondering of beperking op het auteursrecht in het leven te roepen voor \u201c<strong>tekst- en datamining<\/strong>\u201d. <br>Kijken we naar de definitie van dat begrip (artikel 2, lid 2), dan wordt duidelijk dat het daar inderdaad om het bovengenoemde <em>scraping <\/em>gaat:<\/p>\n\n\n\n<blockquote class=\"wp-block-quote is-layout-flow wp-block-quote-is-layout-flow\">\n<p>\u201c&nbsp;<em><strong>tekst- en datamining\u2019<\/strong>: een geautomatiseerde analysetechniek die gericht is op de ontleding van tekst en gegevens in digitale vorm om informatie te genereren zoals, maar niet uitsluitend, patronen, trends en onderlinge verbanden<\/em>.&#8221;<\/p>\n<\/blockquote>\n\n\n\n<p>Niemand die zich daar in de tweede helft van de jaren 2010 overigens druk om maakte. En dat was wel even anders met het eveneens in die DSM-Richtlijn verplicht gestelde <em>uploadfilter <\/em>voor content-sharing platforms! D\u00e1\u00e1r gingen honderdduizenden Europeanen <a href=\"https:\/\/nos.nl\/artikel\/2277726-de-auteurswet-maakte-het-slechtste-in-de-lobbywereld-los\">de straat voor (of liever: tegen)<\/a> op (zonder succes, overigens). Maar de datamining-exceptie werd gewoon zonder slag of stoot geaccepteerd en ook keurig door de Nederlandse wetgever ge\u00efmplementeerd in (o.a.) <a href=\"https:\/\/wetten.overheid.nl\/jci1.3:c:BWBR0001886&amp;hoofdstuk=I&amp;paragraaf=6&amp;artikel=15o&amp;z=2022-10-01&amp;g=2022-10-01\">artikel 15- o van de Auteurswet<\/a>.<\/p>\n\n\n\n<h3 class=\"wp-block-heading\" id=\"h-do-not-scrape\"><em><strong>Do not scrape!<\/strong><\/em><\/h3>\n\n\n\n<p>Daarin is, in navolging van de Richtlijn, bepaald dat een \u201creproductie\u201d (= verveelvoudiging \u2013 <em>LB<\/em>) in dat kader <em>niet<\/em> als auteursrechtinbreuk wordt aangemerkt. Daar zijn wel twee voorwaarden aan verbonden:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li>de <em>miner <\/em>moet rechtmatig toegang hebben gekregen tot het werk (dus geen betaalmuur of password hebben gekraakt) en<\/li>\n\n\n\n<li>het auteursrecht op het geminede \/ gescrapte werk moet niet uitdrukkelijk -liefst machinaal leesbaar- zijn voorbehouden.<\/li>\n<\/ol>\n\n\n\n<p>Dat laatste is op internet vrij gemakkelijk te realiseren door een \u201cdo not scrape\u201d- code op te nemen in de robots.txt file die aan de betreffende pagina hangt.<\/p>\n\n\n\n<p>Je zou dus kunnen zeggen: de makers \/ rechthebbenden die niet willen dat hun werken als leer-voedsel dienen voor AI-generatoren hebben dat zelf in de hand. Een simpele toevoeging bij het online of anderszins digitaal publiceren is voldoende om ongewenst scrapen te voorkomen.<\/p>\n\n\n\n<p>Maar wie heeft dat aan de makers verteld in 2021 of 2022, toen deze oplossing al w\u00e9l bestond maar de makers nog geen idee hadden dat hun werk wel eens gescrapet zou kunnen worden (laat staan dat \u201cdaarmee\u201d nieuwe werken gecre\u00eberd zouden worden)? Om nog maar te zwijgen van makers van werken van v\u00f3\u00f3r het van kracht worden van de DSM-Richtlijn in 2021.<\/p>\n\n\n\n<p>Daar moeten we ook nog maar eens naar kijken\u2026<\/p>\n\n\n\n<hr class=\"wp-block-separator has-alpha-channel-opacity\"\/>\n\n\n\n<p><a id=\"_ftn1\" href=\"#_ftnref1\">[1]<\/a> In 1996 (min of meer) in het World Copyright Treaty van <a href=\"https:\/\/www.wipo.int\/portal\/en\/index.html\">WIPO<\/a> en in 2001 veel explicieter in de EU <a href=\"https:\/\/eur-lex.europa.eu\/legal-content\/NL\/TXT\/?uri=CELEX%3A32001L0029\">Auteursrechtrichtlijn<\/a> (artikel 5, lid 1).<\/p>\n","protected":false},"excerpt":{"rendered":"<p>(AI en auteursrecht, aflevering 6) Het omvangrijkste verveelvoudigen dat generatieve AI-programma&#8217;s doen, gebeurt in hun leerproces &#8211; dat zagen we aan het slot van de vorige aflevering. Want hoe gaat dat in zijn werk? De programma\u2019s leren door \u201cmachine learning\u201d, wat neerkomt op het verwerken van een enorme hoeveelheid data (tekst, beeld, geluid), waar patronen [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":18023,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[4],"tags":[10],"class_list":["post-18013","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-weblog","tag-intellectuele-eigendom"],"_links":{"self":[{"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/posts\/18013","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/comments?post=18013"}],"version-history":[{"count":0,"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/posts\/18013\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/media\/18023"}],"wp:attachment":[{"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/media?parent=18013"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/categories?post=18013"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/testt.lexbruinhof.nl\/index.php\/wp-json\/wp\/v2\/tags?post=18013"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}