Som ett led i diskussionen om öppen vetenskap, initierad av Adam Hjorthén i texten Öppen data – en humanistisk forskningstjuv? publicerar vi ett inlägg från Karin W. Tikkanen, utbildningssamordnare vid Svensk nationell datatjänst (SND), och Gustav Nilsonne, senior rådgivare vid SND. Humtank välkomnar SND:s vilja att fördjupa diskussionen om öppen tillgång till forskningsdata inom humaniora och för att fortsätta samtalet har Hjorthén skrivit ett svar.

Öppen vetenskap är en fråga om demokrati. Det handlar om att göra offentligt finansierad forskning nåbar både inom akademin, mellan olika forskare och olika lärosäten, såväl som utanför akademin, till granskande medier såväl som en intresserad allmänhet.

Adam Hjorthéns inlägg handlar främst om öppna data, det vill säga den del av omställningen till öppen vetenskap som rör forskningsdata. Inlägget ifrågasätter inte relevansen i omställningen i sig, utan huvudfrågan är varifrån tiden att förbereda forskningsdata för delning ska tas. Förväntas den enskilda forskaren använda sin egen betalda arbetstid till detta?

Vi som står bakom detta inlägg är verksamma vid Svensk nationell datatjänst (SND), en organisation som i decennier verkat för att bistå svenska forskare med att göra forskningsdata öppet tillgängliga. SND är idag ett nationellt kompetenscenter med ett nätverk som knyter samman fler än 40 svenska lärosäten och flera forskande organisationer.

Innan vi angriper frågan om vem som ska betala är det värt att nyansera utgångspunkten en aning.

Till att börja med är det inte fullt så enkelt som att ”öppna data” inom humaniora är väsensskilda från data inom naturvetenskaplig, teknisk och medicinsk forskning, på det sätt Adam Hjorthén skriver. Processen att strukturera datamängderna på ett läsbart sätt och att sammanställa den dokumentation som krävs för att någon annan – en forskare eller en granskare – ska kunna förstå och använda sig av materialet, är principiellt densamma inom alla fält. Däremot ligger de naturvetenskapliga, tekniska och medicinska disciplinerna lite längre fram när det gäller beredskapen i att förbereda data för delning, eftersom disciplinerna redan har arbetat på detta sätt i åtskilliga år.

Avsaknaden av en sådan beredskap kan skapa en osäkerhet när det gäller att betrakta det egna forskningsmaterialet som ”data” som kan återanvändas av andra forskare. Förvirringen beror inte sällan på att det saknas en tydlig utvärdering av alla de olika delar som kan ingå i ett humanistiskt forskningsmaterial. Det här är ett område där SND redan har engagerat sig, bland annat inom ramen för sin satsning på forskningsdata från konstnärlig forskning.

Under lång tid har vetenskap kommunicerats huvudsakligen genom det tryckta ordet. I dag finns närmast obegränsade tekniska möjligheter att dela digitala texter, bilder, mätdata, inspelningar med mera, vilket gör det möjligt att återanvända redan insamlat material i nya undersökningar. Det blir också lättare att kritiskt granska publicerade resultat genom att göra nya analyser och pröva olika antaganden. Denna omställning har bara börjat och vi tror att forskarsamhället kommer att behöva utveckla metoder för att bedöma delade data som en viktig forskningsprodukt i samband med anställningar, befordringar och ansökningar om forskningsmedel.

På frågan vad som ska betraktas som forskningsdata, samt vem som ska betala för arbetet att ta hand om det, kan vi ge två olika svar. Båda svaren handlar om värdet i att tänka i termer av delning av forskningsdata ända från början av ett forskningsprojekt. För det första kan man tidigt ställa frågan vilka olika typer av informationsmaterial som kan förekomma inom ramen för projektet, och hur detta bäst kan organiseras och struktureras. Med alla anteckningar i ordning om hur och var man insamlat olika typer av data (hur man nu än väljer att definiera detta), blir det lättare att skriva forskningsartiklar men också att förbereda projektets data för delning. Med andra ord går det att göra mycket av arbetet redan under själva projektets gång.

För det andra är det fullt möjligt att söka extra medel för datahantering redan när man skriver sin forskningsansökan. Både Vetenskapsrådet och Riksbankens Jubileumsfond accepterar att man söker medel för alla slags kostnader för datahantering inom ramen för ett projekt (och som inte ansvarsmässigt ligger på lärosätet). Än en gång: mycket handlar om att tänka i termer av data ända från början.

I den här kontexten är det också värt att upplysa om att det finns personal vid Sveriges lärosäten som kan bistå i dessa frågor, vid de s.k. datastödsenheterna (de kan benämnas på olika sätt på olika lärosäten). Genom dessa instanser kan forskare få kontakt med bibliotekarier, arkivarier, IT-personal och jurister som är särskilt tränade för att kunna svara på frågor som rör forskningsdatahantering – hur man skriver en ansökan, hur man kan urskilja vad som kan klassas som ”forskningsdata”, och allt annat som är bra att tänka på när det gäller forskningsdatahantering.

Adam Hjorthén har helt rätt när han skriver att en framgångsrik implementering av principerna för öppna data kräver en anpassning till humanioras villkor. Det är inte alls att undra på att metoder och arbetssätt som utformats för ett forskningsfält uppfattas som ”obekväma” för forskare aktiva inom andra discipliner, och det är absolut möjligt att sträva efter mer välkomnande och tillåtande tongångar. Men för att åstadkomma detta krävs ett engagemang från båda hållen.

Vi på SND välkomnar humanistiska forskare till en bred diskussion kring olika slag av forskningsdata och hur sådana bäst kan tas om hand. Så länge öppna data inte värderas som en forskningsprodukt i sig kommer delning av data mycket väl att kunna uppfattas som en tidstjuv. Vi uppskattar att Adam Hjorthén för diskussionen framåt och hoppas att denna debatt kommer att fortsätta, och vi deltar mer än gärna i det utbytet av idéer.

Karin W. Tikkanen, docent i latin, utbildningssamordnare vid SND.

Gustav Nilsonne, docent i neurovetenskap, senior rådgivare vid SND.