Släktforskning, fika och AI-projekt

Under den sista medlemsträffen i Nynäshamns släktforskarförening före sommaren körde vi ”släktforskarstuga” och fika. Många hade alltså tagit med sina datorer och började forska med en gång.

Maria Landin passade också på att berätta hur man läser gammal text med hjälp av programmet Transkribus. Hon och föreningsmedlemmen Ingrid Larsson deltar nämligen i ett spännande projekt i Riksarkivets regi där Transkribus utvecklas för att läsa gammal text automatiskt med hjälp av en AI-modell.

I projektet har Riksarkivet knutit erfarna släktforskare till sig för att läsa och transkribera text i gamla dokument. Utifrån det tas sedan en AI-modell fram som till slut ska hjälpa oss att kunna ”maskinläsa” gammal text.

– Jag har hittills skrivit rent omkring 250 000 ord, runt 700 sidor, berättade Maria Landin, som bland annat har läst Trolldomskommissionens protokoll från 1670- och 80-talens häxprocesser.

Ingrid Larsson har arbetat med att kontrollera den text som har transkriberats genom AI-modellen och jämfört den AI-genererade texten med det som står på den ursprungliga sidan.

– Det finns så många handlingar i våra arkiv som inte är digitaliserade och som bara några få kan läsa, handlingar som faktiskt är vårt gemensamma kulturarv. Förhoppningsvis kan det här projektet göra så att fler få tillgång till dokumenten, sa Inger Larsson.

– Den stora utmaningen i projektet är att hitta människor som kan läsa gammal skrift. Alla som vill delta är välkomna att höra av sig till mig, framåt hösten. Men först tar vi lite sommarledigt, sa Maria Landin.

Transkribus är ett holländskt program. Projektet har varit i gång under lite drygt ett år och startade i april 2022. Det ska fortsätta året ut.

Just nu är felprocenten nere på 4,2 procent, berättade Maria Landin.

– Och då får man ta hänsyn till att bokstäverna å, ä och ö inte finns i programmet. Så det börjar bli ganska bra. Sedan är det förstås en sak att kunna läsa vad det står, och sedan att förstå vad det står. Det är helt olika saker.