Kommentarer til MWN- dommen i Oslo Tingrett
[Utkast]
Den 25. mai avsa Oslo Tingrett dom i en tvist mellom MeltWater News AS (MWN) og Mediebedriftenes klareringstjeneste AS.
I diverse mediaoppslag, blant annet i Digi.no og VGnett, hevdes det at dommen innebærer at for å kunne indeksere må en søketjeneste på nettet først skaffe seg samtykke fra rettighetshaver. Dersom det faktisk er gjeldende rett, så har Jon Bing, som er sitert i Digi.no, utvilsomt rett i at «gjeldende rett er problematisk». Etter å ha lest dommen er jeg imidlertid langt fra overbevist. Problemet kan like gjerne være at Tingretten her har avsagt en dom uten å forstå så veldig mye av materien den har behandlet.
Paradoksalt nok mener jeg imidlertid at det ikke nødvendigvis er så galt at Klareringstjenesten vant fram, men at det av den grunn ikke følger at indeksering og søk krever samtykke av rettighetshaverne slik det påstås i Digi.no og VGnett. Det som skurrer her er dommen, som i sin beskrivelse av tjenesten og teknologien den bygger på klarer å få det meste feil.
Beskrivelsen av tjenesten i dommen
På side side 3 i dommen hevdes det for eksempel at:
«I motsetning til andre aktører, som for eksempel Google og Opoint, lager ikke MWN noen kopier av nettsiden, såkalte “cach” [sic] eller “hurtigbuffere”.»
Når jeg undersøkte tjenesten etter å ha lest dommen den 2. juni oppdaget jeg imidlertid at Meltwater faktisk lagret cachede kopier av en rekke sider. Man kunne på det tidspunkt enkelt søke opp slike cachede kopier ved å bruke en URL på formen «http://www.magentanews.com/cache.asp?n=TALL» der «TALL» er et syv-sifret tall. En skjermdump fra 2. juni 2009 av en slik cachet kopi av en side er gjengitt nedenfor.

[I etterkant er jeg av en representant fra MWN blitt gjort oppmerksom på at den cache jeg observerte den 2. juni er en rest av en teknisk løsning som senere er blitt forlatt av MWN. Den misvisende beskrivelsen i dommen skyldes at MWN ikke var kjent med at denne cachen fortsatt ble lagret.]
Jeg mener imidlertid at den omstendighet at en slik cache er tilgjengelig, eller ikke, er forholdsvis uvesentlig i forhold til denne saken, og lar det derfor ligge.
Et sentralt poenget er imidlertid dette: For å overhode kunne indeksere en nettside, så trenger en søkemotor å ha tilgang til en kopi av den siden som indekseres. En slik kopi fremskaffer MWN åpenbart på nøyaktig den samme måte som alle andre søkemotorselskaper. De benytter seg av en en såkalt «robot», som er et program som gjør bruk av HTTP-protokollen til å laste med en verbatim kopi av den nettside som skal indekseres på et arbeidsområde MWNs datamaskiner.
Dette nevnes ikke i dommen, som i stedet roter seg seg inn i en merkelig, detaljert, feilaktig (og etter min mening for saken fullstendig overflødig) beskrivelse av den indekseringsalgoritmen som benyttes på sidene 14f og 20.
Poenget, slik jeg ser det, er at MWNs robot er programmert slik at den kopierer innholdet på innholdsleverandørens side til et arbeidsområde på MWNs server. Dette er utvilsomt en eksemplarfremstilling. At MWN så bearbeider dette eksemplaret som er lastet ned videre for å tilrettelegge for søk må være av underordnet betydning. Eksemplarfremstillingen skjer når innholdet kopieres fra innholdsleverandørens side til MWNs arbeidsområde. Selv om denne kopien slettes så snart indekseringen er utført, så er det ikke en kopiering som er «transient or incidental» (jf. art 5(1) i Directive 2001/29/EC of the European Parliament and of the Council of 22 May 2001 on the harmonisation of certain aspects of copyright and related rights in the information society). Den er derfor en opphavsrettslig signifikant handling. Denne handlingen blir ikke opphevet fordi det nedlastede eksemplaret bearbeides videre.
Rettens forvirring omkring dette kommer blant annet til uttrykk i følgende formulering i dommen:
«I forhold til indekseringsstadiet, må retten legge til grunn at MWN aldri har lagret kopier eller eksemplarer av artiklene. MWN lagrer kun tall som reflekterer metadata som igjen reflekterer informasjon fra artikkelen i indeksen. Med andre ord lagres ikke tall som reflekterer konkrete ord i artiklene.» (s. 10)
Ordet «metadata» brukes i fagterminologien knyttet til indeksering og søk om «data som hefter ved data», dvs. data som gir informasjon om andre data (f.eks. rettighetsinformasjon eller kildeinformasjon). I web-sammenheng er det definert standarder som definerer hva som er metadata og hvordan slike data skal markeres. Det er særlig to metadata-standarder som er viktig, nemlig Dublin Core, som definerer bibliografiske metadata (forfatter, utgiver, etc.), og Robot Exclusion Protocol (REP), som definerer hva slags tillatelse en web-robot (av den type som MWN betjener seg av) har til å indeksere materialet. Tre av de ledende søkemotorselskapene har gått sammen om en felles de facto-standard for REP som gir utgivere ytterligere kontroll over hvordan sidene deres behandles. Dette er beskrevet på egne sider hos henholdsvis: Google, Microsoft og Yahoo!.
Å oversette innholdet på en nettside til en annen representasjonsform (det være seg tall eller elektriske signaler) gjør ikke innholdet om til «metadata». Her benytter (jeg vil si misbruker) retten fagterminologi på en måte som tåkelegger hva det er som egentlig skjer.
Forøvrig er det, som sagt, utvilsomt at prosessen med indeksering starter med at MWN ved hjelp av en såkalt «robot» kopierer det fullstendige inneholdet på de sider som skal indekseres til et arbeidsområde på sin egen maskin før den bearbeiding som MWN gjør starter. Det er derfor uriktig når det i dommen påstas at at «MWN aldri har lagret kopier eller eksemplarer av artiklene.»
I tåkeleggingen av dette saksforholdet får MWN uventet hjelp av Klareringstjenestens advokat, som i sin partsfremstilling (s. 10) bruker en masse unødvendige krefter på indekseringen og de magiske «tallene», mens han ikke nevner den forutgående kopieringen av innholdet med ett eneste ord.
I dommen opereres det med to ulike kategorier søketjenester, som blir benevnt hhv. «nyhetsovervåkere» og «nyhetsaggregatorer», og der skillet øyensynlig er at de første selger en betalingstjeneste til profesjonelle, mens de siste påstås å være for privat bruk og vederlagsfri. Klareringstjenesten krever bare betaling fra de første. Det framgår at Klareringstjenesten mener at Google News faller i siste kategori, MWN i første.
Jeg mener skillet, slik det er beskrevet i dommen, ikke gir noen mening. For det første tilbyr Google (gjennom iGoogle) en løpende overvåkingstjeneste der man kan abonnere på bestemte nøkkelord som egner seg ypperlig for den type profesjonell medieovervåking som MWN tar betalt for. At Google tjener sine penger på annonser framfor abonnement skjønner jeg ikke skal tilsi at Googles tjeneste skal falle i en annen kategori.
Det framgår videre av dommen at tjenesten fram til 6. mars 2009 viste fram søkeordene i kontekst (i søkemotorsammenheng gjerne kalt for «KWIC» eller «snippets», men i dommen omtalt som «treffsetninger»). Slike snippets er utvilsomt sitater, og åvl. § 22 sier at sitat bare kan brukes dersom det skjer i samsvar med «god skikk»:
Magnus Stray Vyrje skriver om «god skikk» i «Vennebog til Mogens Koktvedgaard» (Nerenius & Santerus Förlag, 1993) s. 109:
«I kravet om god skikk ligger bl.a. at sitatretten aldri må utøves i økonomisk konkurranse med opphavsmannen. Å tilegne seg fruktene av andres arbeid er ikke god skikk. Formålet må være lojalt.»
Rettighetshaverne har gjennom Klareringstjenesten som forretningside å utnytte dette materialet kommersielt ved å inngå avtaler med søketjenester som retter seg mot et betalingsmarked, og har også en rekke slike avtaler med bl.a. Visma, Infopaq, Opoint og Retriever Norge. Da har jeg problemer med å forstå at MWNs bruk av slike «snippets», som ikke tjener til noe annet formål enn å få betalt for formidlingen av dem, kan oppfattes som lojal. Dette drøftes så vidt jeg kan se ikke av retten i det hele tatt.
Den mest interessante opplysningen i saken kommer imidlertid bare fram i forbifarten, der det framgår (s. 7) at «Herunder ble det vist til at MWN har nektet å oppgi navnet på sin “user-agent”.»
Hva dette innebærer framgår ikke særlig klart av dommen, men det er utvilsomt en henvisning til den tidligere omtalte REP, som siden 1994 har blitt brukt av alle seriøse søketjenester på Internett til å regulere adgangen til å indeksere nettsider.
Fra en representant for MWN har jeg imidlertid fått forklart at selskapet ikke ønsker å oppgi navn på sin “user-agent” fordi selskapet mener at Klareringstjenestens benytter REP diskriminerende. Bakgrunnen for dette finner vi at REP både kan rette sitt direktiv om å ikke besøke et nettsted til samtlige roboter, og til bestemte, navngitte roboter.
Denne formen av REP forbyr enhver robot å besøke et nettsted:
User-agent: *
Disallow: /
Mens den formen som brukes i eksemplet under vil tillate at alle andre roboter en roboten med navn «Robby» besøker nettstedet.
User-agent: Robby
Disallow: /
Slik jeg forstår MWN, så frykter selskapet at dersom Klareringstjenesten får kjennskap til MWNs “user-agent”, så kommer denne til å instruere sine medlemsbedrifter i å benytte REP til å gi beskjed om at MWNs robot ikke har tillatelse til å besøke medlemsbedriftenes nyhetsnettsteder, samtidig som slike begrensinger ikke vil bli gjort gjeldende for andre søkertjenester (som Google). Dette mener MWN som en konkurransevridende og utilbørlig bruk av REP, som selskapet ikke ønsker å ta del i.
REP og (utenlandsk) rettspraksis
Drøftinger av REP ser så langt ut til å være fraværende i norske rettstvister omkring indeksering og lenking. Nedenfor refereres en del sentrale saker fra utlandet.
I januar 2006 ble det i saken Field vs. Google truffet en viktig prinsipiell beslutning av United States District Court, District of Nevada. Blake Field var poet og advokat, og publiserte små dikt i bloggen sin på Internett. Når Google indekserte diktene hans gikk han til sak, og forlangte erstatning for det han mente var ulovlige kopier som Google hadde framstilt for å gjøre sidene søkbare. Googles forsvar var at Field hadde en mulighet til å reservere seg fra at sidene hans ble kopiert og indeksert av Google. Googles web-robot var konstruert slik at den ikke ville kopiere noe innhold fra et nettsted dersom det på nettstedet befant seg en fil med navn «robots.txt med et direktiv (disallow) som (ifølge REP) forbyr en robot å kopiere eller indeksere nettstedet. Field hadde imidlertid ikke fulgt denne standarden, og dermed hadde sidene hans blitt kopiert. Retten kom til at i og med at Google fulgte denne standarden, og at Field valgte å ikke benytte seg av den, så kom Googles bruk under såkalt «fair use». Denne dommen kan imidlertid ikke overføres til Europa, siden «fair use» er et begrep som er tett knyttet til USAsk opphavsrett som ikke har noe direkte motstykke i europeisk rettspraksis. Jeg synes likevel dommen er interessant, fordi retten legger til grunn et prinsipp jeg mener er fornuftig, nemlig prinsippet om at en aktør som publiserer i et bestemt medium, har en selvstendig plikt til å sette seg inn i, og i den utstrekning det er formålstjenlig, benytte de de facto standarder, konvensjoner og sedvaner som er særegne for mediet.
I september 2006 tapte imidlertid Google et tilsvarende søksmål som var anlagt av Copiepresse, som representerte en rekke belgiske nettpublikasjoner. Det omstridte i denne saken var Googles cache, der nettavisartiklene fortsatt lå tilgjengelig og kunne leses, etter at de var flyttet fra nettavisenes gratissider og inn i et arkiv der man måtte betale for tilgang.
Figuren nedenfor viser et treff i Google på søkeordet «Google». Hovedlenken (Search Engine Survey) lenker til siden der søkeordet forekommer. Under vises en «snippet» der søkeordet vises uthevet i kontekst (to ganger). Under dette, i grønt, vises URL til siden. Til høyre for URL er det en lenke med etiketten «Cached», som lenker til en kopi av siden slik den så ut når den ble indeksert av søkemotoren.
En slik arkivert kopi er i mange sammenhenger en nyttig og legitim tjeneste. Normalt vil brukeren velge hovedlenken, som tar henne direkte til utgiverens nettside. Dersom, for eksempel, den opprinnelige siden er midlertidlig utilgjengelig, eller dersom den er endret slik at informasjonen på den ikke lenger er relevant i forhold til søkeordet, så kan brukeren få tilgang til informasjonen med å klikke på Cached-lenken. Men i noen sammenhenger kan en slik kopi være i strid utgivers interesse, og det var dette som var begrunnelsen for søksmålet fra Copiepresse.
Når Google ga brukere adgang til en arkivert versjon av en indeksert nettside på slutten av 1990-tallet introduserte de samtidig en mekanisme der en utgiver kunne fortelle Googles robot at innholdet på en indeksert nettside ikke skulle arkiveres. Dette kunne utgiver gjøre ved å plassere en metadata-tagg noarchive i hodet på siden, slik:
<meta name="googlebot" content="noarchive">
Google argumenterte følgelig for at nettavisene, ved at de ikke hadde benytte seg av de mulighetene til å reservere seg mot å la sitt innhold bli arkivert av Google som forelå, hadde gitt implisitt tillatelse til arkivering.
I februar 2007 ga retten Copiepresse medhold på samtlige punkt. Googles påstand om at avisene som ikke ønsker å bli indeksert eller arkivert i Google-cache kan reservere seg mot dette gjennom å benytte nevnte mekanisme blir i dommen avvist på følgende måte:
[C]opyright is not a right of opposition but a right for prior authorisation; That this means that the authorisation must be obtained in a certain way, prior to the intended use;
Resultatet av dommen var at Google rett og slett sluttet å indeksere nettaviser i Belgia.
Om denne beslutningen fra Googles side hadde innvirkning på antall besøkende på nettavisenes sider vites ikke, men i mai 2007 ble det sendt ut en felles pressemelding fra Google og Copiepresse, der det sto at partene var blitt enige og at Google nå skulle begynne å indeksere belgiske nettaviser igjen. Når det gjaldt den omstridte cache-funksjonen, så uttaler partene dette:
«The newspapers' websites will now again be linked from Google News, but the content itself will be protected by a noarchive tag.»
Jeg mener det premiss som legges til grunn for den fellende dommene i Belgia mot Google i 2007. er feil.
Retten insisterer altså på at det for å kunne skal innhentes en eksplisitt tillatelse fra rettighetshaver på forhånd. Men det er rett og slett ikke praktisk mulig for et søkemotorselskap å gjøre dette, gitt det store mangfoldet av utgivere og den hastigheten mye av innholdet på nettet oppdateres med. Derfor har søkemotor-industrien i fellesskap utviklet REP, som gjør det mulig å for rettighetshavere å oppnå den kontrollen over søkemotorens arkivering og tilgjengeliggjøring av innhold som de ønsker, men på en måte som er tilpasset nettmediet, dvs. på en måte som egner seg for maskinell behandling, og derfor er billig i drift og særdeles velegnet for formålet.
Forliket mellom Copiepresse og Google fra mai 2007 er utenomrettslig. Men jeg mener det, og dommen i Field vs. Google fra 2006, uttrykker den eneste fornuftige konklusjonen i denne typen konflikter. En søkemotor, enten den nå kalles en «nyhetsovervåker» eller «nyhetsaggregator» bør forvente at det innhold det får servert av en maskin under kontroll av rettighetshaver, fritt kan kopieres og arkiveres i cache, samt gjøres finnbart gjennom en søketjeneste, med mindre rettighetshaver uttrykkelig reserverer seg mot dette vha. industristandarden REP.
Konklusjon
Av saken mellom MWN og Klareringstjenesten ser det ut til at MWN, i motsetning til Google, ikke er inneforstått med REP og ikke ønsker å respektere protokolen/standarden, i alle fall dersom dette innebærer at sidene er merket på en måte som diskriminerer MWN i forhold til andre søkemotorselskaper som MWN betrakter som konkurrenter.
I så fall mener jeg at MWN har en innstilling til hvordan søketjenester på WWW skal oppføre seg som avviker fra det som etter min oppfatning er god og etablert forretningsskikk innenfor området. Siden jeg ikke er jurist så skal jeg være varsom med å trekke en juridisk konklusjon av denne observasjonen, men i mine øyne strider slik adferd mot markedsføringsloven § 1 (generalklausulen).
Tingretten baserer imidlertid sin slutning på at MWNs indeksering innebærer eksemplarfremstilling i åvl. § 2 sin forstand. Det er jeg vel ikke helt uenig i, og særlig ikke dersom Tingretten hadde lagt til grunn for dette den enkle omstendighet at en web-robot i utgangspunktet produserer en verbatim kopi av alt det innholdet den samler inn. Men i utgangspunktet mener jeg at dette ikke nødvendigvis er en ulovlig eksemplarfremstilling. Hvorvidt den er lovlig eller ulovlig bør drøftes i lys av sedvane på nettet og god forretningsskikk for søkemotorer – og det unnlater Tingretten å ta stilling til.
Men beskrivelsen av selve indekseringen i dommen er både snodig og unødvendig, og etter min mening roter Tingretten seg ganske langt inn i tåka i denne saken. Det hjelper selvsagt ikke på forståelsen at begge parter stiller med advokater som tilsynelatende gjør sitt beste for å tåkelegge hvordan indeksering ved hjelp av web-roboter foregår, eller at metadatabegrepet brukes på en måte det ikke finnes faglug belegg for.
Problemet med Tingrettes begrunnelse, og da særlig dersom man ikke kjøper det etter min mening oppkonstruerte skillet mellom «nyhetsovervåkere» og «nyhetsaggregatorer» er at man med samme begrunnelse kan hevde at enhver bruk av web-roboter strider mot åvl. § 2. Rent bortsett fra at det neppe er en ønskelig konklusjon, er den også fullstendig urimelig, gitt sedvane og praksis på nettet siden 1994.
Min personlig oppfatning er at MWN burde tape denne saken, men av helt andre grunner enn de Tingretten anfører. Ved å ikke å samarbeide om å honorere REP bryter de både med god forretningsskikk (mfl. §§ 1, 25), og ved å formidle sitater mot betaling i form av «snippets» bryter de i tillegg med god skikk for lojal sitatbruk.
UTKAST - fortsatt under arbeid. Vennligst ikke siter fra denne versjonen.
Copyright © 2009
Gisle Hannemyr.