Bild: Glenn Carstens-Peters/Unsplash
Artikel från Högskolan i Skövde

Den här artikeln bygger på ett pressmeddelande. Läs om hur redaktionen jobbar.

En studie av arkiverade doktorsavhandlingar visar att bara 0,1 procent var sparade på ett långsiktigt säkert sätt. Information riskerar att gå förlorad i framtiden för att man använder fel digitala format.

När digitala textdokument ska arkiveras behövs standardiserade format som är utformade för lång livslängd. Ett sådant exempel är formatet pdf/a-1b.

Dokument riskerar att bli oläsliga

I en studie har forskare undersökt hur svenska lärosäten arkiverat doktorsavhandlingar mellan åren 2007 och 2016. Av totalt 21 611 pdf-filer är det endast omkring sex procent av filerna som hävdar att de överensstämmer med pdf/a-1b. Av dessa är det dock bara 14 stycken som till fullo klarar en kontroll av överensstämmelse med standarden. Därmed är den långsiktiga arkiveringen inte säkerställd och information riskerar att i framtiden gå förlorad.

För organisationer i offentlig sektor är detta en nyckelfråga, menar forskarna bakom studien. Kommer pdf-filer som lagras på lång sikt fortfarande kunna läsas, återges eller bearbetas enligt avsikten från deras skapare när originalprogramvaran inte längre är tillgänglig?

Använda öppen programvara

– En långsiktigt god förvaltning förutsätter användning av format som har implementeras i öppen programvara. Den kompletta källkoden till programvaran behöver finnas tillgänglig under villkor som möjliggör långsiktig förvaltning av såväl dokument som programvara, säger Björn Lundell, professor i datavetenskap vid Högskolan i Skövde.

Forskningen visar att det finns ett antal brister i analyserade programvaror som till del är en konsekvens av brister i det implementerade formatet. Mycket talar för att tekniskt komplicerade format, på sikt, kommer att leda till oönskade inlåsningseffekter och hinder för att olika system ska kunna fungera tillsammans och kunna kommunicera med varandra.

Rekommendationer till offentliga verksamheter

Baserat på resultaten i studien ger forskarna en rad rekommendationer till offentliga verksamheter. Offentliga organisationer måste öka den interna medvetenheten om vikten av att använda format av god teknisk kvalitet. Formaten behöver uppfylla definitionen av öppen standard enligt statens offentliga utredning 2009:86 och ha implementerats i öppen programvara. Under upphandlingsprocessen behöver även de offentliga verksamheterna ställa krav på bättre stöd för pdf/a-1, menar forskarna.

– Målet måste vara att slutanvändare av olika programvaror korrekt ska kunna skapa filer i öppna format för vilka det existerar en god implementation i öppen programvara, säger Björn Lundell.

Läs mer: Strategi för myndigheternas arbete med e-förvaltning

Vetenskaplig artikel:

Achieving Conformance to Document Standards: Can PDF Files Conform to the PDF/A-1b Specification?.

Kontakt:

Thomas Fischer, lektor i datalogi vid Högskolan i Skövde, thomas.fischer@his.se, Björn Lundell, professor i datavetenskap vid Högskolan i Skövde, bjorn.lundell@his.se

Nyhetsbrev med aktuell forskning

Visste du att robotar som ser en i ögonen är lättare att snacka med? Missa ingen ny forskning, prenumerera på vårt nyhetsbrev!

Jag vill prenumerera