7. Datastandarder
För att säkra största möjliga användbarhet, och möjlighet att hitta relevant data som sparas i samlingsförvaltningssystemet, bör systemet vara uppbyggt enligt de mest använda standarderna för metadata.
Dessa standarder beskriver bland annat hur data ska registreras i systemen. Om standarderna följs garanteras att informationen är konsekvent registrerad även för stora och ibland heterogena samlingar.
Observera att även om systemet är uppbyggt i enlighet med dessa standarder så är det avgörande för användbarheten HUR data registreras.
Om ett fält inte används på ett konsekvent sätt (till exempel att fältet “Geografisk härkomst” bara används för föremålets geografiska härkomst och inte för att registrera information om en avbildad plats eller liknande) så kommer museet inte att ha standardiserad data fast man använder sig av ett standardiserat system.
Om data däremot registreras konsekvent enligt standarder blir den inte bara mer användbar inom museet utan det blir även lättare att utbyta data mellan institutioner och system.
Det finns olika typer av datastandarder som är relevanta i det här sammanhanget. Standarderna kan gälla struktur, format eller innehåll.
Standarder för struktur och dataelement
Metadatastandarder beskriver vilka fält eller element som behövs för att identifiera och dokumentera ett objekt. I samlingsförvaltningsstandarden Spectrum kallas dessa element för informationsenheter men i mer allmänna sammanhang används även begreppet dataelement.
I kulturhistoriska sammanhang omfattar de till exempel följande: identifikations- eller objektnummer, titel eller objektbeteckning, tillkomst av objektet, datering, geografisk härkomst, dimensioner, material och förvärv.
Den mest omfattande standarden för beskrivning av dataelement och struktur i samband med kulturarvsinformation är CIDOC CRM, en ontologi som har tagits fram av Icoms dokumentationskommitté, CIDOC. CIDOC CRM är även ISO-standard sedan 2006 (ISO 21127:2006) och har aktualiserats 2014 (ISO 21127:2014).
Bra grund
CIDOC CRM är en bra grund för systemutvecklare som ägnar sig åt utveckling och vidareutveckling av samlingsförvaltningssystem, eftersom den beskriver vilka dataelement som behövs och vilka relationer som ska finnas mellan de olika elementen. Den är väletablerad och garanterar att informationen i samlingsförvaltningssystemen blir jämförbara och kompatibla med andra system.
En tillämpning av CIDOC CRM är dataformatet Lightweight Information Describing Objects (LIDO). Vid val av samlingsförvaltningssystem är det värdefullt att kräva att systemet är anpassat mot CIDOC CRM och till exempel kan exportera data i formatet LIDO. Det kan både förenkla samarbete med aggregatorer och även förenkla att byta system i framtiden.
Andra standarder och standardiserade dataformat som används för att beskriva kulturarvsinformation är bland andra Categories for the Description of Works of Art (CDWA), Cataloging of Cultural Objects (CCO) och Europeana Data Model (EDM).
Det finns flera standarder för annan typ av information som är vanligt förekommande bland kulturarvsinformation såsom Dublin Core (generell metadatastandard) och Darwin Core (observationsdata/naturhistoriska samlingar).
Observera att de flesta standarder är för omfattande för att användas som en allmän riktlinje om vilken information museet måste registrera om samlingarna. Några standarder tillhandahåller dock även en lista över obligatoriska dataelement, till exempel CDWA core categories, som ger en bra riktlinje för vilken information museet bör fokusera på vid katalogisering.
Utgå från vad som är viktigast
Med utgångspunkt från dataelementen som finns listade i standarden bör museet själv bestämma vilka av dessa som är viktigast för dokumentation av den specifika samlingen. Beroende på vilken sorts samling museet förvaltar är olika informationsenheter mer eller mindre viktiga för specifika museer.
Förvaltar museet till exempel en samling med många föremål i drift blir det viktigare att fokusera på fält för status, åtgärder som underhåll, bevakningsdatum för besiktningar, än det kan vara för andra museer.
I och med att samlingsförvaltningssystem inte bara sparar information om objekten utan även om aktiviteter i samband med samlingsförvaltning, så är samlingsförvaltningsstandarden Spectrum en viktig riktlinje vad gäller definiering av dataelement som behövs i ett samlingsförvaltningssystem.
Dessa dataelement finns beskrivna på sidan ”Spectrumprocesserna och samlingsförvaltningssystem.” De viktigaste dataelement som bör finnas i ett samlingsförvaltningssystem är listade i kravspecifikationstabellen, där de är grupperade efter Spectrum-processerna.
Standarder för registrering
Dataformatstandarder är riktlinjer om HUR informationen ska registreras i fälten.
Dessa riktlinjer berör främst syntax, stil och grammatik som företrädesvis ska användas. Det finns i dag inga vedertagna svenska standarder om hur information bör registreras. Men det är viktigt att museet upprättar tydliga och noggranna riktlinjer kring detta. Enkla principer att börja med är till exempel att beskrivningar ska registreras i hela meningar med korrekt grammatik, utan förkortningar eller akronymer.
Vid registrering av enstaka ord, till exempel material, eller vid upprättande av egna ordlistor, till exempel över fordonstyper eller verktyg i museets samlingar, bör det definieras i förväg att de ska registreras i obestämd form och i singularform. Internationella dataformatstandarder är bland annat Cataloging of Cultural Objects (CCO) och Describing Archives: A Content Standard (DACS).
Standarder för innehåll (vokabulärer)
Vokabulärer är listor med vedertagna begrepp som ska användas för registrering av viss information, oftast i form av ett auktoritetsregister, tesaurus eller enklare ordlista.
Väletablerade och internationellt använda exempel på vokabulärer är Gettys Vocabularies, som kan användas som länkade data och finns att ladda ner i olika format. Mest använda är Art and Architecture Thesaurus (AAT) och Thesaurus of Geographic Names (TGN).
Om systemet inte tillåter en direkt uppkoppling mot Gettys vokabulärer online är det en bra idé att registrera Gettys URI för begreppet i museets egen ordlista, till exempel http://vocab.getty.edu/page/aat/300041379 för “litografi”. Om samlingarna innehåller verk av många internationella konstnärer, kan det även vara gynnsamt att använda sig av Gettys Union List of Artist Names. Internationella standarder som handlar om tema eller avbildat subjekt är till exempel Iconclass och Library of Congress Subject Headings.
Vokabulärer på svenska
Många svenska museer använder vokabulärer på svenska såsom de register och ordlistor som finns på KulturNav, en gemensam webbaserad terminologi- och auktoritetsplattform särskilt utvecklad för nordiska museer och andra kulturarvsinstitutioner.
Plattformen förvaltas av det norska företaget KulturIT i samverkan med kulturarvsorganisationer i Norge och Sverige. Vokabulärer på KulturNav kan vara mer specifika för nordiskt kulturarv. De innehåller till exempel listor över fartygstyper och liknande.
De olika listorna på KulturNav förvaltas av olika museer och kulturarvsinstitutioner. Även här gäller att om vokabulärer i KulturNav inte kan användas som länkade data direkt i systemet, är det en bra början att registrera URI:na i museets egen ordlista, till exempel http://kulturnav.org/eea0da69-db7b-4289-a55e-437dee98ea5b för “trossbåt”.
En annan möjlighet att säkra internationell återanvändbarhet av museets data genom egna auktoritetslistor och vokabulärer är att registrera Wikidatas URI:er, till exempel http://www.wikidata.org/entity/Q133036 för litografi, som referens till termen eller auktoritetsposten om till exempel en person. Wikidata länkar ofta vidare till andra auktoritetslistor och är därför en bra nod om man vill jobba mot att på sikt göra sitt innehåll tillgängligt som länkade öppna data.