Videnskabeligt forlag sælger adgang til forskeres artikler til Microsofts AI-udvikling – AU-professor føler sig taget ved næsen
Den akademiske forlagsvirksomhed Taylor & Francis sælger adgang til sine forskningsartikler til techvirksomheders AI-udvikling. Forskerne, der har udgivet hos forlagets tidsskrifter, har intet fået at vide om det. Professor Peter Dalsgaard føler sig taget ved næsen og efterlyser en ny tilgang til samarbejder med større forlag.
Mange forskere hævede øjenbrynene i midten af juli, da en litteraturforsker fra det hollandske Leiden University, Ruth Alison Clemens, skrev et opslag på det sociale medie X. Hun havde hørt rygter om, at det prestigefyldte, over 150 år gamle akademiske forlag Taylor & Francis havde solgt adgang til forlagets mange forskningsartikler til Microsofts AI-udvikling for otte millioner pund, svarende til 71 millioner kroner.
Og den var god nok. Mediet The Bookseller skrev 19. juli om Taylor & Francis’ nye indtægtskilde, og 25. juli kunne mediet så berette, at Taylor & Francis har indgået endnu et AI-samarbejde. Forlagets moderselskab Informa forventer, at de to aftaler vil indbringe 513 millioner kroner i 2024. Ifølge The Bookseller ønsker Taylor & Francis ikke at oplyse, hvem forlaget har solgt adgang til ud over Microsoft, som er storinvestor i OpenAI, der står bag ChatGPT.
Just found out that Taylor & Francis has sold access to all @routledgebooks data to Microsoft to train their AI. This includes my publications. I get no payment for using my research labour, never mind the bigger problems of this energy-intensive extractivism...
— Dr Ruth Alison Clemens (@RuthieClems) July 17, 2024
Salget har vakt forargelse blandt forskere, fordi det er dem, der – uden betaling - bidrager til forlagets indhold med forskningsartikler, bøger og lignende, men ikke har fået nogen besked om de nye samarbejder fra forlaget selv. Ville de blive kompenseret for en tredjeparts brug af deres forskning til udvikling af kunstigt intelligente værktøjer, og havde de mulighed for at sige nej til at bidrage?
En af de forskere, der er forundret, er professor i informationsvidenskab på Aarhus Universitet Peter Dalsgaard, som selv forsker i kunstig intelligens. Peter Dalsgaard har udgivet en håndfuld forskningsartikler og et bogkapitel hos Taylor & Francis’ tidsskrifter, men nyheden om forlagets nye AI-samarbejder har fået ham til at overveje, om han i fremtiden skal droppe det store forlag.
”Jeg ser det som et ret markant tillidsbrud, og jeg er ret overrasket over, at de tør at gøre det. Man ved jo godt, at de opererer ud fra profithensyn, men det virker som en voldsom ting at gøre,” siger Peter Dalsgaard.
Han har ikke fået nogen information om de nye samarbejder fra Taylor & Francis eller et af deres tidsskrifter, Routledge, som han har udgivet hos, på trods af at det ifølge ham er et ret indgribende valg, forlaget har taget.
”Jeg sagde i sin tid ja til, at de måtte publicere min forskning. Det er den forventning, man er gået ind i samarbejdet med. Men her har forlaget taget det et skridt videre og sagt: De her artikler kan også bruges til andre formål. Og derfor føler jeg – og mange af mine kolleger, som jeg kan læse på sociale medier – mig taget ved næsen, fordi de bruger det, vi har leveret til dem, til noget andet. Og ikke nok med det, så sælger de det videre til tredjepart og vil ikke nødvendigvis fortælle os, hvem det er, og hvad det vil blive brugt til. Og vi ved jo, at der er alle mulige former for problematikker ved store sprogmodeller og træningen af AI,” siger Peter Dalsgaard.
Taylor & Francis: Indholdsbrug er strengt kontrolleret
Taylor & Francis forklarer i et skriftligt svar, at samarbejdet med AI-udviklere skal hjælpe forlaget til at udvikle sine egne AI-hjælpemidler. Forlaget svarer dog ikke direkte på en række af Omnibus’ spørgsmål, herunder om forskerne bag indholdet har modtaget nogen information om AI-samarbejdet, om forskerne bliver kompenseret for brugen af deres artikler, eller om forskerne har haft mulighed for at trække egne forskningsartikler ud af samarbejdet. Forlaget svarer heller ikke på, hvordan det stiller sig overfor, at flere forskere nu har udtrykt deres bekymring over at udgive forskningsartikler hos Taylor & Francis i fremtiden.
”Taylor & Francis bruger i stort omfang maskinlæring, kunstig intelligens og automatiseret teknologi inden for områder som indsendelse af forskning, forskningsintegritet, plagiat og autenticitet. Ligesom mange andre udforsker vi nye applikationer, der vil forbedre forskningen og gøre det nemmere at analysere data, generere hypoteser, automatisere opgaver og arbejde på tværs af discipliner og researchidéer. Vi har indgået nogle selektive partnerskaber med førende AI-virksomheder for at fremskynde dette arbejde, som inkluderer at give adgang til en række arkivindhold til forsknings- og træningsformål, hvilket understøtter nøjagtigheden og relevansen af AI-modeller, især LLM'er (large language models, red.). Som med alle vores licensaktiviteter er indholdsbrug strengt kontrolleret, og rettighedsindehavere vil modtage royalties i overensstemmelse med deres kontrakter”, skriver Taylor & Francis i det skriftlige svar.
Peter Dalsgaard: Helt fundamentale ting går fløjten
Peter Dalsgaard er heller ikke blind for mulighederne ved AI-teknologier i forskningen, forklarer han.
”Det er et af de områder, jeg ser et stort potentiale i. Altså at kunne se mønstre i rigtigt store datamængder og hjælpe med at sammenfatte og analysere på tværs af dem. Allerede i dag er der redskaber, som virkelig kan komme forskere til gavn. Men når jeg bruger de redskaber, så sidder jeg som forsker hele tiden og overvejer, i hvor høj grad jeg kan stole på de ting, der kommer ud af det, og hvordan det bliver gjort. Er der ting, som bliver skjult for mig? Er det repræsentativt, hvad der bliver vist for mig? Der er vigtige metodologiske overvejelser i det for en forsker,” siger han.
Professoren understreger, at det er forskerne, der leverer indholdet, mens det er forlagene, der skummer fløden.
”Lad os så sige, at forlagene giver techvirksomhederne mulighed for at hjælpe dem med at udvikle AI-teknologier og udvikler nye services på forlagene, som vi også skal betale for at bruge. Så har vi leveret indholdet til dem og det redaktionelle arbejde, som de har brugt til at træne AI-systemer, som de så sælger tilbage til os. Det virker lidt som skruen uden ende,” siger han.
Et salg af videnskabelige artikler til en tredjepart er et tab af den kontrol og transparens, der hidtil har været, mener Peter Dalsgaard.
”I dag har vi jo klassiske måder, hvorpå vi ved, hvordan vores arbejde bliver brugt. Hvis nogen bruger mit arbejde, er der tydelige regler for, hvordan de skal citere mig og henvise til, at det er mit arbejde, der ligger til grund for det. En af de måder, den videnskabelige verden fungerer på, er, at man kan spore tingene tilbage til deres kilde. Det er notorisk svært at gøre med store sprogmodeller. Helt fundamentale ting går fløjten, ved at forlaget giver andre adgang til indholdet på måder, som vi slet ikke har nogen mulighed for at inspicere eller komme med indvendinger overfor,” siger han.
Kollektivt opråb
Ifølge Peter Dalsgaard tydeliggør situationen, at forskere er nødt til at tage det ”mere alvorligt”, hvilke rettigheder de giver forlagene til deres arbejde. Det konkrete eksempel med Taylor & Francis giver et billede af, at forlaget udmærket er klar over, de sidder på magten, mener han.
”Vi må finde ud af, om vi har mulighed for at trække vores samtykke tilbage på et tidspunkt. Om vi skal vi have klausuler ind, der siger, at de kun må bruge det til disse formål, og vil de bruge det til andet, så skal vi acceptere det. Når man lige nu kigger tilbage, virker det, som om man bare har skrevet under på noget, og så har vi sikkert uforvarende foræret forlagene rettighederne til vores arbejde,” siger han.
”Vi har alle implicit taget for givet, at vi giver dem ret til at udgive en artikel i et tidsskrift, som vi selv har indsendt det til, og som vores kolleger i god tro har leveret redaktionelt arbejde til. Nu viser det sig, at det også kan bruges til alle mulige andre formål. Og det kan godt være, de har loven på deres side, men set fra min side er det etisk meget problematisk,” siger Peter Dalsgaard.
Han agter at bringe emnet op i Akademisk Råd på Arts, hvor han sidder, og i det større billede gør han sig overvejelser om, hvordan forskerne i fællesskab kan gøre noget. Men samtidig er han klar over, at han taler fra en forskningsmæssig privilegeret position, som ikke alle har. For at komme til tops er yngre forskere bevidste om, at de prestigefyldte forlag er en del af vejen frem.
”Det er nemmere for mig at sige som veletableret forsker. Men jeg tror også, at det er sådan nogle som mig, der er nødt til at gøre noget ved det. For hvis man står som yngre forsker, er ens karriere til dels bestemt af de publikationsstrukturer og det prestigiøse system, som er indbygget i det. Det kan være svært for mig at sige til en ph.d.-studerende eller postdoc, at nu skal de stoppe med at publicere i de her prestigiøse tidsskrifter, hvis deres karriere afhænger af det,” siger han og fortsætter:
”Det må være en form for kollektivt opråb eller potentielt boykot, der skal til. Man ser jo en gang imellem, at en hel redaktion trækker sig fra et tidsskrift, fordi de af den ene eller anden grund kommer på kollisionskurs med forlaget. Det er noget, der virkelig vækker opsigt i videnskabelige kredse,” siger Peter Dalsgaard og understreger, at det kun fungerer, hvis forskerne selv har alternativer til de veletablerede forlag klar.
Også Wiley tjener på AI-samarbejder
Noget tyder på, at de videnskabelige forlags samarbejder med techvirksomheder er en begyndende tendens. Den 29. juli skrev mediet Inside Higher Ed, at også det store forlag Wiley har indgået AI-aftaler. Et AI-samarbejde med ”en stor techvirksomhed” er fuldendt, mens endnu et samarbejde realiseres i 2025, skriver forlaget i en pressemeddelelse fra juni.
Som en reaktion på Taylor & Francis' salg af adgang til artikler til udvikling af AI har Storbritanniens største fagforening for alle typer af professionelle forfattere i en pressemeddelelse udtrykt sin kritik:
”Vi er meget bekymrede over at se udgivere skrive kontrakter med techvirksomheder uden at rådføre sig med forfatterne og skaberne først. Der er substantielle ophavsretlige, moralske og databeskyttelsesmæssige spørgsmål, som kræver at blive besvaret, ligesom der er etiske spørgsmål om gennemsigtighed og retfærdig betaling for AI-virksomheders brug af andres arbejde”, skriver foreningen.
Flere forskere bekræfter på X, at de intet har fået at vide fra Taylor & Francis. Professor i antropologi på University of Oxford, Eben Kirksey, skriver for eksempel:
”Um, vær venlig at betale os? Taylor & Francis tjener millioner på at sælge videnskabelige artikler til Microsoft AI. Giv i det mindste forfatterne muligheden for at fravælge denne pengehungrende datafangst”.
Um, pay us please? Taylor and Francis is making millions by selling academic articles to Microsoft AI. At least give scholars and published authors the right of opting out of this money making data grab. https://t.co/g0HLBtUSMm
— Eben Kirksey (@eben_kirksey) July 20, 2024
Olav W. Bertelsen, lektor og fællestillidsrepræsentant for de videnskabelige medarbejdere på AU’s fakultet Natural Sciences, skriver på X, at det ”er tid til for akademikere, universiteter og stater verden over at tage fuld kontrol over videnskabelige publikationer. De kommercielle udgivere er blevet unødvendige parasitter”.
Ifølge The Bookseller har Taylor & Francis i de første seks måneder af dette finansielle år omsat for cirka 2,6 milliarder kroner. Moderselskabet Informa forventer en omsætning på over 8 milliarder kroner i 2024.
Korrekturlæst af Charlotte Boel