Nyt AI-center på AU skal undersøge kunstigt intelligente sprogmodeller – og måske bidrage til udviklingen af et dansk alternativ til ChatGPT

AU's nye Center for Language Generation and AI (CLAI) bringer 22 forskere fra blandt andet lingvistik, kognitionsvidenskab, litteratur, filosofi og uddannelse sammen om at undersøge og udvikle automatiseret tekstgenerering. Det er en kraftfuld teknologi i rivende udvikling, der kræver, at universiteterne følger med, siger centerleder Mads Rosendahl Thomsen.

CLAI kommer i sin forskning til at trække på fagområder som lingvistik, kognitionsvidenskab, filosofi og uddannelse. Ud over centrets leder og viceleder er der i øjeblikket 22 forskere tilknyttet. Foto: AU

Opdateret 23/8/2023: Det er præciseret yderligere i artiklen, at udviklingen af den danske sprogmodel sker på Center for Humanities Computing under ledelse af professor Kristoffer Laigaard Nielbo.

For bare et år siden var AI og kunstigt intelligente sprogmodeller ikke ligefrem et emne, der trak overskrifter eller genererede debat i frokoststuen. Men med lanceringen af ChatGPT i november sidste år kom de fleste på fornavn med teknologien, som både bekymrer og begejstrer.

På den baggrund har Aarhus Universitet taget initiativ til at oprette det nye center for kunstigt intelligente sprogmodeller, nemlig Center for Language Generation and AI (CLAI), som åbner officielt 20. september, men som allerede har afholdt de første seminarer. Centret er placeret på Institut for Kommunikation og Kultur og ledes af litteraturprofessor Mads Rosendahl Thomsen og viceleder Rebekah Baglini, der er lektor i lingvistik.

Mads Rosendahl Thomsen forklarer, at den kunstige intelligens inden for sprog udvikler sig hastigt. Derfor er det naturligt, at AU nu skaber et center for forskning i netop det. For at sætte konkrete tal på blev ChatGPT's brugerbase sidste år den hurtigst voksende nogensinde med over 100 millioner brugere inden for de første to måneder af sin levetid.

”For os, der har arbejdet med sprog på forskellige måder, er det tydeligt, at det her er noget, der er meget kraftfuldt og af almen interesse, og derfor er det vigtigt, at universiteter tager det op. Bag disse 'Large Language Models' ligger en masse teknologisk udvikling, hvoraf det meste er sket i USA. Men her på AU har vi også forskere, der arbejder med modellerne og udvikler på dem. På Center for Humanities Computing arbejdes der på en dansk sprogmodel. Lige så vigtigt er det dog, at vi eksempelvis får de pædagogiske erfaringer med, hvad teknologien betyder for eksempelvis lingvistik, filosofi, litteratur og kreativitet,” siger Mads Rosendahl Thomsen og uddyber:

”Hvis man er velbevandret i, hvordan Large Language Models teknisk fungerer, betyder det ikke, at man er velbevandret i at validere, hvad der kommer ud af modellerne. Det er ekstremt vigtigt at finde ud af, hvordan vi bedst bruger dem og forstår, hvordan de fungerer i praksis,” siger han.

Et dansk alternativ til ChatGPT

Selv om Large Language Models og kunstig intelligens umiddelbart lyder som et mere eller mindre afgrænset område, er det altså ikke tilfældet. Centret kommer i sin forskning til at trække på fagområder som lingvistik, kognitionsvidenskab, filosofi og uddannelse. Ud over centrets leder og viceleder er der i øjeblikket 22 forskere tilknyttet.

Kigger man på centrets nuværende projekter, vil man se, at det allerede er fuldt beskæftiget, og at projekterne begyndte, inden CLAI kom på benene. En af forskerne er professor i filosofi Johanna Seibt, der i årevis – lang tid før ChatGPT – har forsket i, hvordan mennesker og robotter interagerer. En anden tilknyttet forsker er professor Kristoffer Laigaard Nielbo, der også selv er leder på Center for Humanities Computing. Han leder udviklingen af en danskbaseret Large Language Model. Et projekt, som flere af forskerne på det nye center arbejder på, herunder viceleder på CLAI, Rebekah Baglini.

Hun fremhæver muligheden for at skabe 'open source'-sprogmodeller, der i modsætning til for eksempel skaberne bag ChatGPT, OpenAI, gør den bagvedliggende models data og detaljer gennemsigtige.

”Vi er nødt til at have alternativer til de modeller, der kommer ud af USA, hvis de fortsætter med at svigte i forhold til at imødekomme EU’s standarder for privatliv og sikkerhed,” siger hun og forklarer, at det i virkeligheden ikke er urealistisk at skabe det samme som ChatGPT i en dansk skala.

”Der er ingen iboende barrierer, der forhindrer os i at konkurrere med Big Tech-sprogmodeller. De har lige fået et forspring, og vi er hurtigt ved at indhente det,” siger Rebekah Baglini.

Et andet projekt, hun også er en del af, omfatter forskere fra Cognitive Science og lingvistik, som forsøger at udvikle en model, der kan differentiere AI-skabt tekst fra tekst skabt af mennesker.

Hun fortæller, at forskerne på CLAI planlægger at mødes hver anden uge og præsentere hinanden for deres foreløbige resultater i de forskellige projekter.

”Hver gang vil en gruppe få mulighed for at præsentere sine resultater og få feedback med det samme. Så med CLAI bygger vi en struktur rundt om allerede eksisterende forskningsinitiativer,” siger Rebekah Baglini.

Nye projekter skal tilføre finansiering

Der ligger ikke nogen stor bevilling bag centret. Mads Rosendahl Thomsen kalder det med et smil for et fattigt center. Han håber dog, at samarbejdet blandt forskerne kan lede til nye projekter, der kan skaffe finansiering.

”Centret er en måde at arbejde bedre sammen på og forhåbentlig også kunne komme op med nye, gode idéer, der vil gøre os i stand til at skaffe finansiering til at udforske dem. Selvfølgelig er vi interesseret i at få flere fokuserede projekter, så at finde midler er en del af det, vi skal gøre. Men vi er allerede privilegerede, ved at vi har en masse forskere, der vil bruge deres tid og denne platform til bedre samarbejde,” siger Mads Rosendahl Thomsen.

Begge er optimistiske på vegne af fremtiden for sprogmodellerne, som de forudser vil komme til at fylde mere og mere.

”Vi må anerkende, at det er et område, der vil rykke sig meget de kommende år; også på måder, vi ikke kan forudsige. Men samtidig er der de menneskelige og etiske spørgsmål, som hvordan vi skaber bedre uddannelser, og hvordan vi bruger værktøjerne ansvarligt, som ikke vil forsvinde, og det er dem, der vil være den røde tråd i vores arbejde,” siger Mads Rosendahl Thomsen.

Studerende er nysgerrige på teknologien

De mærker også de studerendes nysgerrighed og interesse for at beskæftige sig med fordele og ulemper ved den hastigt voksende teknologi, fortæller Rebekah Baglini.

”De er meget ivrige efter at blive informerede brugere af de her værktøjer, fordi de ved, at det bliver noget, de skal være dygtige til, og at det vil blive forventet af dem, når de kommer ud på arbejdsmarkedet. Så jeg mener, vi har et ansvar for at tænke meget grundigt over, hvordan vi taler med vores studerende om det,” siger hun.

Mads Rosendahl Thomsen supplerer ved at trække det dilemma op, som i den grad omgærder de kunstigt intelligente sprogmodeller:

”På den ene hånd er der en masse interessante og vigtige problemer, som skal tænkes igennem, og på den anden hånd siger vi til os selv: Den her teknologi er faktisk virkelig fantastisk,” siger han.

Korrekturlæst af Charlotte Boel