Digitaaliset lehtiarkistot

Nykyään uutisteksti elää paperilehteä paljon kauemmin, koska suuri osa teksteistä löytyy myös verkosta. Tulevaisuudessa digitaaliset arkistot palvelevat tutkijoita, ja voivat samalla olla ansiolähde lehdille.

Sekä Suomessa että Ruotsissa sanomalehtiarkistoja digitoidaan ahkerasti. Ruotsissa on ollut kaksi erillistä projektia, Digidaily 1 ja Digidaily 2. Ensimmäinen projekti päättyi maaliskuussa 2013 ja toinen projekti päättyy maaliskuussa 2014.

Ensimmäisen projektin aikana digitalisoitiin Aftonbladet vuosilta 1830–2010 ja Svenska Dagbladet vuosilta 1884–2010. Sivuja digitalisoitiin yhteensä noin 3 miljoonaa.

– Päämäärämme oli kehittää prosesseja historiallisten sanomalehtien joukkodigitalisointiin. Digidaily 2 keskittyy moderniin sanomalehtimateriaaliin ja päämääränä on löytää tehokkaita prosesseja, jotta Kungliga biblioteket voi siirtyä mikrofilmauksesta digitalisointiin. Tämä on iso haaste, varsinkin kun käsittelemme myös kokonaisia editioita, Digidailyn projektijohtaja Kungliga bibliotekissa Heidi Rosen sanoo Addetolle.

Toisen projektin lehdistä Rosen mainitsee Dagens Industrin.

– Se on mielenkiintoinen lehti, koska se on painettu värilliselle paperille emmekä tiedä, miten tämä vaikuttaa OCR-tulkintaan, eli optiseen tekstintunnistukseen. Ehdimme myös digitalisoida jonkun toisen lehden Digidailyn 2:n aikana, mutta emme ole vielä päättäneet lehteä.

Sanomalehtien joukkodigitalisointi

Digidaily 2:n päämääränä on digitalisoida noin 2,4 miljoonaa sivua. Tämän lisäksi projekti pyrkii parantamaan optista tekstintunnistusta.

Heidi Rosenin mukaan molemmat projektit ovat kehitysprojekteja, joissa Kungliga biblioteket ja Ruotsin Kansallisarkisto tekee yhteistyötä sanomalehtien joukkodigitalisoinnin mahdollistamiseksi.

– Yritämme yhdistää korkean laadun ja suuren määrän, ja automatisoida niin monta prosessia kuin mahdollista, myös laadunseurannan. Kungliga biblioteket tekee nyt työtä rajapinnan kanssa, joka voidaan ottaa käyttöön vuonna 2014, mutta moni kysymys pitää vielä ratkaista, varsinkin tekijänoikeuksiin liittyvät kysymykset, Rosen sanoo.

Digidaily 2:n rahoituksesta vastaavat EU:n rakennerahoitus Keskinorlannissa, Ruotsin Kansallisarkisto, Kungliga biblioteket, Mittuniversitetet ja Länsinorlannin lääninhallitus. Digidaily 1:n rahoittajana toimi myös Schibsted Ruotsi.

Presstanda on suomenruotsalainen lehtiarkisto

Suomessa Bragen sanomalehtiarkisto tuottaa uutta Presstanda-palvelua, joka on suomenruotsalaisten sanomalehtien digitaalinen arkisto. Arkistosta löytyy yhteensä kahdeksan eri lehden jutut.

Tämän lisäksi Presstanda on tehokas hakupalvelu vanhojen ja uudempien artikkeleiden löytämiseksi. Tekijänoikeuslakien takia materiaali ei ole saatavilla lehtien maksumuurien ulkopuolella, mutta materiaalin voi tilata Bragen sanomalehtiarkistosta.

– Itse asiassa kuka tahansa voi hyötyä palvelusta. Olemme yrittäneet tehdä rajapinnasta mahdollisimman intuitiivisen, Bragen sanomalehtiarkiston päämies Jessica Parland-von Essen sanoo Hufvudstadsbladetille.

Mielipidekirjoituksessa Tidningstexter värdefullt kulturarv Hufvudstadsbladetissa Parland-von Essen on kirjoittanut siitä, miten digitaaliset arkistot tulevaisuudessa voivat toimia lehtien uusina ansiolähteinä. Hän muistuttaa, että kun materiaali kerran on tuotettu, sen saatavilla pitäminen ei maksa erityisen paljon.

– Jotta journalistiikka kannattaisi taloudellisesti, pitää jo tuotettua materiaalia käyttää enemmän ja levittää pidemmälle kuin paperimaailmassa. Digitaalisessa maailmassa yksittäiset artikkelit voivat löytää tiensä yksittäisille lukijoille, jotka eivät aikaisemmin ole pystyneet löytämään materiaalia, ja jotka ovat valmiita maksamaan sisällöstä, Parland-von Essen kirjoittaa.

– Jokainen julkaistu artikkeli muodostuu myös heti osaksi historiaa ja arkistoja. Arkistot antavat uutisille asiayhteyden, taustan ja selitykset. Sen takia on yhä tärkeämpää pitää arkistot saatavilla, sekä journalistiikan että materiaalin tuottamisen taloudellisten investointien takia. Lehtitekstit ovat arvokasta kulttuuriperintöä siitä hetkestä, kun ne syntyvät, Parland-von Essen päättää tekstinsä.

Kansalliskirjaston historiallisesta sanomalehtiarkistosta voi selata lehtiartikkeleita vuosilta 1700- ja 1800-luvuilta. Kansalliskirjasto on nimittäin digitalisoinut suurimman osan lehdistä, jotka ilmestyivät Suomessa vuosina 1771–1900. Digitalisoituja sivuja on yhteensä 1,7 miljoonaa ja ne ovat kaikki vapaasti selattavissa.

Suomenkielistä modernia lehtiarkistoa ei vielä löydy Suomesta.

Lisätietoa:
Digidaily 
Presstanda
Hufvudstadsbladetin uutinen Presstandasta
Tidningstexter värdefullt kulturarv 
Historiallinen sanomalehtikirjasto 

Teksti: Michaela von Kügelgen

arkisto

uusimmat uutiset