Medborgarforskning och AI-teknik skapar ett Swedish Lion
På Riksarkivet pågår forskning om automatiserad handskriftstolkning som Riksantikvarieämbetet med flera finansierar. En stor mängd handskrivna dokument från 1600-tal och framåt kommer lättare att kunna läsas och analyseras av forskare och allmänhet och vara till stor hjälp för bland andra släktforskare.
I Sverige finns stora mängder handskrivna dokument, från medeltid till nutid. Dokumenten är källor till grunden för kunskap om Sveriges historia och de är viktiga för till exempel släktforskning och hembygdsforskning.
För många är det svårt att läsa de äldre handskrivna dokumenten och det går inte heller att söka i texterna då dokumenten är skannade bilder av dokument, inte digital text.
Riksantikvarieämbetets forskningsbidrag
För att öka möjligheterna att använda och forska utifrån äldre handskrivna dokument har Riksantikvarieämbetet gett forskningsbidrag under tre år till ett projekt som bidrar till utvecklingen för att transkribera och göra dokumenten sökbara. Projektet heter ”Transkriberingsnod Sverige – maskintolkning och medborgarforskning kombinerade”.
– Det är ett spännande projekt som Riksarkivet och Göteborgs universitet bedriver och vi beviljade projektet drygt 800 000 kronor per år mellan 2022 och 2024. Vi ser att den här forskningen gör mycket nytta både för forskare och allmänhet, säger Helena Victor, samordnare för forskningsfrågor på Riksantikvarieämbetet.
Swedish Lion I
Ett av målen med projektet är att bygga datamodeller som läser och tolkar stora mängder handskrivna källmaterial. Det kallas HTR-modeller, där HTR står för Handwritten Text Recognition.
En av modellerna som forskarna på Riksarkivet med flera tar fram baseras på AI-teknik och har fått namnet Swedish Lion I.
– Vår forskning handlar om att med hjälp av medborgarforskare träna en AI att automatiskt tolka handskrivna källor. Det krävs samarbete mellan forskarna, medborgarforskare och de institutioner som har källorna, alltså de handskrivna dokumenten, säger David Haskiya, för chef på AI-labbet på Riksarkivet.
Medborgarforskning
Medborgarforskning handlar om att allmänheten hjälper forskare att undersöka olika frågor. Det vanligaste är att personer som inte är forskare hjälper forskare att samla in eller granska stora mängder data och släktforskning är ett exempel på medborgarforskning.
Släktforskning är utbrett i Sverige. Exakt hur många som släktforskar finns det inte siffror på men betydligt fler än 100 000 svenskar släktforskar enligt Sveriges släktforskarförbund.
– En av frågorna vi arbetar med är att undersöka hur medborgarforskare och AI-teknik samspelar vid utvecklingen av automatiserad handskriftstolkning, säger David Haskiya.
David Haskiya presenterade arbetet med Swedish Lion I på en internationell forskarkonferens, Heritage Science Sweden Forum, i mitten av maj i år.
När du vill veta mer
- Radiointervju med David Haskiya från konferensen Heritage Science Sweden Forum (sr.se)
- Exempel på dialog mellan forskaren och chattjänst för att omvandla 1600-tastext till modern svenska (chatgpt.com)
- Prova att använda transkribergsmodellen Swedish Lion I (readcoop.eu)
- Riksarkivets forskningsprojekt (riksarkivet.se)
- Riksantikvarieämbetets bidrag för forskning och utveckling
- Mer om forskarkonferensen Heritage Science Sweden Forum