Forskning

Danske forskeres brug og vurdering af Generativ AI i forskning

Dansk Center for Forskningsanalyse ved Aarhus Universitet har gennemført en landsdækkende undersøgelse af forskeres brug af og holdning til GenAI på tværs af danske universiteter.

Serge P.J.M. Horbach, docent, Radboud Universiteit
Evanthia Kalpazidou Schmidt, lektor, Aarhus Universitet
Lise Degn, lektor, Aarhus Universitet

Kunstig intelligens er ved at transformere alle sektorer i samfundet, herunder forskningen,på måder vi endnu ikke fuldt ud forstår eller kan regulere. Generativ Kunstig Intelligens (GenAI) vinder især hurtigt frem
på tværs af forskningsområder og forventes at accelerere og ændre vidensproduktionen markant. Den usikkerhed, der følger med teknologier som GenAI, har udløst intense debatter om dens potentielle fordele, risici og udfordringer i forskningen – både i de nordiske lande og globalt.

Ligesom i andre dele af samfundet er integrationen af GenAI i akademia præget af en bred vifte af holdninger og praksisser, der er i hastig udvikling. Debatten spænder fra entusiastisk brug til forsigtig vurdering og skepsis. Efterhånden som teknologien fortsætter med at påvirke forskningslandskabet, bliver det stadig vigtigere at forstå dens anvendelse og dens konsekvenser for forskningsprocesser og forskningsresultater.

Flere aktører, såsom tidsskrifter og forlag, finansieringsorganer og forskningsinstitutioner, arbejder allerede på initiativer for at regulere brugen af GenAI i forskning. Det er dog vigtigt at forstå forskernes praksisser og holdninger, for at sådanne initiativer skal have en chance for at være effektive.

I disse år ser vi en række studier, som fremhæver både GenAI’s potentiale til at effektivisere forskningsprocesser og forskernes bekymringer omkring transparens, misinformation, bias og andre ukendte konsekvenser, men der er stadig kun ganske få systematiske undersøgelser af, hvordan teknologien bruges på tværs af akademiske miljøer og forskningsområder.

På trods af teknologiens stigende udbredelse, ved vi stadig ganske lidt om hvordan GenAI’s anvendelse varierer mellem discipliner, karrierestadier og demografiske faktorer såsom køn. GenAI kan potentielt
bruges i alle faser af forskningen – fra planlægning og dataindsamling til analyse og rapportering – men omfanget af anvendelsen og dens indvirkning på forskningsintegriteten er endnu ikke fuldt belyst.

Nyt studie fra Aarhus Universitet

For at belyse disse spørgsmål har forskere fra Dansk Center for Forskningsanalyse ved Aarhus Universitet gennemført en landsdækkende undersøgelse af forskeres brug af og holdning til GenAI på tværs af danske universiteter (Andersen et al. 2024).

Formålet med undersøgelsen er at skabe en dybere forståelse af GenAI’s rolle i akademia ved at analysere, hvordan forskere fra forskellige fagområder bruger og vurderer teknologien i deres forskningspraksis. Resultaterne fra undersøgelsen kan hjælpe med at udvikle skræddersyede retningslinjer for ansvarlig og etisk brug af GenAI i forskning.

Undersøgelsen er, som nævnt, et landsdækkende studie af alt videnskabeligt personale på danske universiteter. Ved at indsamle kontaktoplysninger fra institutionernes hjemmesider blev undersøgelsen sendt til 29.498 personer, hvoraf 2.527 (8,6 procent) gav fuldstændige svar, og yderligere 533 respondenter (1,8 procent) besvarede spørgeskemaet delvist. Respondenterne var godt fordelt på tværs af videnskabelige områder og demografiske baggrunde.

Med udgangspunkt i en liste med 32 potentielle anvendelser af GenAI til forskningsformål blev respondenterne spurgt, om de havde brugt GenAI til det pågældende formål, om de kendte en nær kollega, der havde brugt det til samme formål, og hvordan de vurderede brugen af GenAI i relation til forskningsintegritet (målt på en syvpunktsskala fra ‘problematisk forskningspraksis’ til ‘fremragende forskningspraksis’).

Redaksjonen ba ChatGPT om å lese denne artikkelen og lage en illustrasjon for bladet. Så langt kan vi fastslå et tjenesten har visse begrensninger Problemet her at AI-billedbehandling ikke forstår tekst og behandler bokstaver som alle andre grafiske elementer.

Positive vs. kontroversielle anvendelser af GenAI

Et af undersøgelsens første fund er, at selvom brugen i de fleste tilfælde er relativt begrænset, er der opgaver hvor anvendelsen af GenAI allerede er blevet (næsten) ‘standard’ praksis. Dette gælder især sprogredigering, i f.eks. ansøgninger, abstracts eller forskningsartikler, hvor (næsten) halvdelen af respondenterne angiver, at de bruger GenAI.

Overordnet set er den selvrapporterede brug af GenAI fortsat begrænset til en håndfuld forskellige forskningsopgaver, idet kun 8 ud af 32 praksisser anvendes af mindst 25 procent af respondenterne.

Vurderingerne af brugen af GenAI varierede ligeledes betydeligt – altså om forskerne vurderer at brugen af GenAI er en god/ansvarlig praksis. Overordnet set er forskerne ret positive i deres vurderinger, men vi ser også en del variation inden for spektret.

For de fleste praksisser lå den gennemsnitlige vurdering i intervallet »god« til »fremragende« forskningspraksis. Dette var især tilfældet for de praksisser som relaterer sig til sproglig redigering (f.eks. i skrivning af ansøgninger, redigering af forskningsartikler, formatering af referencer) og dataanalyse (f.eks. oprettelse af koder til analyse eller simulering, mønstergenkendelse, transskribering af forskningsoptagelser).

Respondenterne var også generelt positive over for praksisser relateret til oversættelse af forskningsresultater for at kommunikere til forskellige målgrupper (f.eks. oversættelse af forskningsartikler til andre sprog, oprettelse af lægmandsresuméer af forskningsresultater og oprettelse af præsentationer til akademiske arrangementer). Til gengæld var respondenterne meget mere kritiske over for brugen af GenAI i andre forskningsopgaver, især de mere grundlæggende opgaver i forbindelse med udformning af eksperimenter eller teoretiske rammer samt kritisk evaluering af andet arbejde i forbindelse med peer review.

Højere GenAI-brug blandt tekniske fag og yngre forskere – dog uden kønsforskelle

Et særskilt formål med undersøgelsen var at forsøge at identificere eventuelle forskelle i brug og vurdering på tværs af discipliner og måder at producere viden på.

Vi ser i undersøgelsen en relativt høj grad af konsistens i brugsmønstre på tværs af discipliner, men der er dog variationer, når vi dykker længere ned i materialet.

Fx ser vi at der er en lidt større andel af respondenter fra de tekniske videnskaber, særlig inden for eksperimentelle tekniske videnskaber, der bruger GenAI til et højere antal forskellige praksisser; i nogle tilfælde over halvdelen af de praksisser, der er nævnt i vores undersøgelse.

Modsat er humanistiske forskere mindst tilbøjelige til at bruge GenAI-værktøjer. Et interessant fund her er også at kvantitative samfundsforskere angiver, at de anvender GenAI-værktøjer i betydeligt flere scenarier end deres kvalitative kolleger. Disse mønstre gik også igen i vurderingen af praksisserne.

Med hensyn til akademisk erfaring fandt vi, at yngre forskere bruger GenAI til flere opgaver end deres ældre kolleger og vurderer brugen af GenAI mere positivt, men til gengæld finder vi ikke nogen signifikante forskelle i brug af GenAI mellem mænd og kvinder.

Mere positive holdninger ved intensiv brug

En interessant observation opstod, da vi sammenlignede respondenternes GenAIbrug med deres vurdering af ansvarligheden ved denne brug.

Ikke overraskende fandt vi en generel (omend beskeden) positiv sammenhæng mellem rapporteret brug og vurdering. Mere interessant er det, at for næsten alle praksisser var andelen af respondenter, der rapporterer en praksis som god, meget god eller fremragende, højere end andelen, der rapporterer at have brugt GenAI til den.

Det indikerer, at selvom den rapporterede brug af GenAI stadig er relativt lav, er det usandsynligt, at tilbageholdenhed i brugen af GenAI til flere opgaver primært skyldes overvejelser om ansvarlighed/integritet.

Dette understøttes yderligere af en sammenligning af de samlede vurderinger og angivelser af brug. Respondenter, der rapporterer brug af GenAI i flere sammenhænge, udviser også mindre variation i deres vurderinger; med andre ord, jo mere brug jo større enighed om vurdering. Omvendt var der større variation i vurderingerne blandt respondenter, der enten ikke havde brugt GenAI eller kun anvendt det i meget få brugssager. Det tyder på at disse respondenter er ikke helt afklarede med, hvordan de skal vurdere brugen af GenAI i forskningen.

Opfattelsen af GenAI i forskning i Danmark

Vores undersøgelse peger altså på, at der stadig er ret begrænset brug af GenAI i det danske forskningslandskab – og at der er forskel på hvordan teknologien opfattes på tværs af discipliner, vidensformer og generationer. Vi kunne i undersøgelsen identificere 3 distinkte måder at opfatte GenAI på, som illustrerer denne forskel.

Først og fremmest har vi en gruppe, som ser “GenAI som arbejdshest”. Denne klynge (35,2 procent af respondenterne) omfatter forskere, der ser brugen af GenAI til oprettelse og redigering af softwarekoder, statistisk analyse og mønstergenkendelse som god praksis. De er dog mere skeptiske over for GenAI’s rolle i peer review-processen og idegenereringsfasen. Kommentarer fra denne klynge indikerer, at GenAI betragtes som nyttig til tekniske opgaver, men mindre egnet til kreative opgaver.

Dernæst har vi en gruppe som ser “GenAI kun som sprogassistent”. Denne klynge (24 procent af respondenterne) er mest skeptisk over for GenAI og vurderer generelt dets brug negativt, med undtagelse af sprogrelaterede opgaver såsom sproglig redigering og transskribering. Kommentarerne i denne klynge beskriver GenAI som en avanceret stavekontrol og mener, det er nyttigt primært til sproglige forbedringer,
ikke til selve forskningen.

Til sidst har vi gruppen, som ser “GenAI som forskningsaccelerator”. Denne klynge (40,7 procent af respondenterne) er generelt meget positive over for GenAI og vurderer dets brug i de fleste scenarier som
gavnlig, især til dataanalyse og forskningsdesign. Få scenarier vurderes negativt, og
kommentarerne peger på, at GenAI hjælper med at øge produktiviteten.

Der er dermed en betragtelig variation i opfattelsen af GenAI i forskning i Danmark, som kalder på opmærksomhed – ikke mindst fra institutionerne. Forskerne i undersøgelsen efterspørger guidelines og træning, og der er ingen tvivl om at dette behov kun vil forøges. Som nævnt, var en væsentlig motivation bag undersøgelsen at tilvejebringe et vidensbaseret perspektiv på GenAI i forskning, som den igangværende policyudvikling kan bygge ovenpå.

I Danmark arbejder en arbejdsgruppe fx i øjeblikket med at revidere det danske kodeks for forskningsintegritet, og er i den forbindelse blevet pålagt at inkludere overvejelser omkring brug af GenAI i ansvarlig forskningspraksis.

Vi har med denne undersøgelse forsøgt at tilvejebringe et mere nuanceret billede af hvilke variationer der er i brug og opfattelser af denne nye teknologi. Vi håber, at resultaterne kan danne grundlag for en konstruktiv
dialog mellem skeptikere og entusiaster, samt skabe en dybere forståelse for teknologiens potentiale og udfordringer inden for forskningen.

Reference:
Andersen, J.P.; Degn, L.; Fishberg, R.; Graversen, E.K.; Horbach, S.P.J.M.; Kalpazidou Schmidt, E.; Schneider, J.W.; Sørensen M.P. (2024). Generative Artificial Intelligence (GenAI) in the research process – a survey of researchers’ practices and perceptions. Under review i Technology in Society.

Illustrasjon: Moor Studio1