Länka dina data
Att länka data om kulturarvet och publicera dem öppet möjliggör olika typer av återanvändning och forskning. Länkad öppen data avser sammankoppling av data och dataset på ett sätt som inte bara är läsbart för människor, utan också maskiner. Om metadata och data publiceras öppet kan de anslutas och berikas av andra. En av de största fördelarna med länkad öppen data är att den blir sökbar och möjliggör avancerade sökfrågor.
Under den här sessionen fick vi först en introduktion till länkade öppna data (till och med kallade strukturerade öppna data) från David Haskiya (tidigare Riksantikvarieämbetet). Alicia Fagerving (Wikimedia Sverige) presenterade Wikidata, en öppen och fri kunskapsbas som lagrar strukturerad data för Wikimedia-systerprojekt.
Vad är länkad öppen kulturarvsdata?
David Haskiya (bilder/presentation) inledde sin introduktion med en visualisering för att förklara vad länkade data handlar om. Han använde exemplet August Strindberg, en svensk författare, och relationerna mellan honom och andra platser, personer och ämnen. Länkade data kommer i tripplar, med ett subjekt, ett objekt och ett predikat som beskriver relationen mellan de två. Efter exemplet kan en trippel vara August Strindberg (subjekt), som studerat vid (predikat) Uppsala universitet (objekt). Var och en av dessa identifieras entydigt med URI:er, som kopplar entiteten ”August Strindberg” till en förtydligande auktoritetsfil.
David förklarade också de fyra principerna för länkade data och hur länkade data blir länkad öppen data. Det är fallet när författaren eller ägaren till uppgifterna släpper dem med en öppen licens, t.ex. CC0 för metadata. Detta är faktiskt en förutsättning för att andra ska kunna skapa länkar, redigera innehåll och återanvända informationen. David presenterade också exempel för länkad öppen data och hur den används i kulturarvskontexten. Europeana använder till exempel länkad öppen data för sina sökförslag, samlar in data från och om specifika konstnärer, författare eller andra på dedikerade webbsidor och tillåter plattformen att bli flerspråkig. Andra exempel var Open Library, K-samsök och Kringla samt generösa användargränssnitt och möjligheterna till datavisualisering. Vissa av dessa, till exempel K-samsök, tillåter också att användaren skapar egna länkar och samarbetar kring länkade data:
”Vi har en viss kunskap om innehållet i våra samlingar. Ändå är det ofta så att personer utanför våra institutioner vet ännu mer om ett specifikt objekt eller en person. Det kan vara bra att öppna upp och ge dem möjlighet att berika din data. ” David Haskiya
I den sista delen av sin presentation vred David sig till de första stegen som kulturarvsinstitutioner kan ta inom länkad öppen data. Det viktigaste steget är att se till att arbeta med länkad öppen data faktiskt är det rätta sättet att ansluta till er publik och fullfölja ert egna uppdrag. I så fall borde institutionerna titta runt, prata med kollegor och lära sig om andras erfarenheter. David rekommenderade att delta i befintliga samarbeten och plattformar för att lära sig mer om länkad öppen data i praktiken. Eftersom data är hjärtat i denna aktivitet, bör investeringar i datakvalitet och katalogisering bli en prioritering och att arbeta med kontrollerade vokabulärer/auktoriteter är ett bra sätt att börja med (David tillhandahöll en lista här; datakvalitet stod också i fokus för vår session ”Let’s talk data”).
Wikidata som en möjlighet till länkad öppen data för ABMK-institutioner
Från ett mer generellt perspektiv på länkade öppna data vände vi oss till ett specifikt exempel på länkade öppna data: Alicia Fagerving (presentation) presenterade Wikidata, en gratis och öppen plattform för strukturerad data. Wikidata skapades 2012 och är ett systerprojekt av Wikipedia.
Alicia förklarade möjligheterna att engagera sig med Wikidata: Alla kan redigera deras mer än 70 miljoner objekt. Uppgifterna är tillgängliga under CC0 och kan därför återanvändas i alla slags sammanhang:
”Du kan använda data från Wikidata utan attribut. Detta är av stor betydelse för praktiken: Om du använder blandad data från en rad olika källor är det inte lätt att göra det om du måste ange licensen för varje källa och varje dataobjekt. ” Alicia Fagerving
Som en central databas för strukturerad information på Wikipedia är det också en lösning för att uppdatera icke-språkbaserad information på olika Wikipedia-sidor samtidigt. Alicia presenterade som exempel infoboxar på Wikipedia, som innehåller information såsom födelsedatum och invånarantal.
På Wikidata har varje objekt sitt unika Q-nummer. Alicia presenterade hur tripplar hjälper till att samla fakta om ett objekt. För att bevisa att något är tillräckligt viktigt för Wikidata och kan identifieras, kopplas det till exempel till externa auktoritetsfiler som Libris eller kulturarvsinstitutionernas inventeringsnummer. Med hjälp av SPARQL, ett semantiskt frågespråk, kan användare ställa frågor om all data i Wikidata – och välmodellerade länkade data gör det möjligt för användare att hitta exakt de svar de behöver.
Som Alicia förklarade är Wikidata en resurs för Wikipedia, men du kan också använda den i andra sammanhang eftersom den erbjuder öppen information om alla möjliga typer av ämnen. Kulturarvsinstitutioner kan använda Wikidata för att sprida kunskap om historiska ämnen inom deras kompetensområde. Ett första steg kan vara att lägga till information om en konstnär eller ett konstverk i din samling eller uppdatera informationen om din institution i Wikidata (detta kommer också att påverka vad sökmotorer som Google visar i sökresultat om din institution). Hen framhöll också att en stor del av uppgifterna i Wikidata faktiskt kommer från import från andra databaser – och kulturarvsinstitutioner kan arbeta med Wikimedia och inte behöver ladda upp sina data till Wikidata manuellt.
Att ta med sig
- Länkade öppna data är information som lagras i tripplar, med ett subjekt och ett objekt länkat av ett predikat som beskriver deras specifika förhållande, släppt under en öppen licens.
- Externa auktoritetsfiler hjälper till att identifiera entiteterna.
- Länkad öppen kulturarvsdata möjliggör det för användarna att undersöka datan och ställa specifika frågor om informationen.
- Kulturarvsinstitutioner kan engagera sig genom att gå med i befintliga initiativ och organisationer, som Europeana, Wikidata eller andra, dela sina data öppet eller bidra med referenser och kunskap från sina samlingar till Wikidata.
- Datakvalitet och rika metadata är särskilt viktiga aktiviteter som institutioner kan börja med, eftersom det inte bara hjälper dem i projekt om länkad öppen data utan i nästan alla digitala aktiviteter.
Gå till nästa session om användargenererat innehåll!
Mer information
Association of Research Libraries (2019): White Paper on Wikidata. Opportunities and Recommendations.
Europeana: Linked Open Data.
Manu Sporny: What is Linked Data? på Youtube
Sanja Halling (2016): Auktoritetsfiler och beständiga identifierare i praktiken. Digisam.
Urban Complexity Lab, University of Applied Sciences Potsdam: Examples for generous user-interfaces and visualisation.
Wikidata: Introduktion, med vägledningar för nya användare.
Wikidata – SPARQL:
- the Wikidata Query Service
- en SPARQL tutorial, provided by Wikidata
- Exempel för SPARQL queries
Wikipedia: Linked data.