Under hösten gör jag praktik på institutionen för idé och lärdomshistoria och det här inlägget kommer främst beröra min artikelsökning i Kungliga Bibliotekets digitala tidningsarkiv.
I min arkivsökning försöker jag reflektera och tydliggöra för mig själv, så detaljerat som möjligt, hur jag letar i det digitala arkivet och hur jag förhåller mig till materialet. Vad är det som gör att en artikel är relevant och en annan inte? Jag noterar praktiska problem i min sökning något jag beskriver nedan. Arkivet innehåller svenska dagstidningar från 1645. Jag kan välja att sortera på tidning, årtal/månad, län och politisk beteckning i förekommande fall. Träffarna kan jag sortera efter datum eller relevans. Tidningens innehåll är indexerat vilket innebär att jag kan söka på ord som finns i löptexten. Vid en sökning markeras sökorden i löptexten med rosa transparent kulör. Artikeln som innehåller det markerade sökordet gulmarkeras på ett liknande sätt som sökorden men på ett något mer godtyckligt vis än text. Det verkar svårare för sökmotorn att identifiera artikelns start och avslut än att identifiera själva sökordet.
Av en slump upptäcker jag ett fall där sökmotorn helt missar ett av mina sökord. Det är inte bara jag som ibland har svårt att tyda tidningens typografi verkar det som. Trots detta upplever jag att fördelarna med digitalt material och den här typen av indexering är svårslagna när det gäller att snabbt söka igenom stora mängder material. Den uteblivna sökträffen får mig att tänka på hur man som forskare förhåller sig till material de inte hittar? Ett problem som naturligtvis måste gälla även fysiskt källmaterial . Några av de sökord jag använt är ”Refraktor”, ”Astrograf”, ”Dubbelrefraktor”, ”Transitinstrument”, ”Meridiancirkel” och ”Schmidt-teleskop” som alla är termer på astronomiska instrument. Flest träffar får jag på termen ”Refraktor” som i kombination med ”Stockholms observatorium” därför får utgöra början på min databas. När jag utökar sökordskombinationen till ”Refraktor och Stockholms observatorium” uppstår dock ett nytt problem. Jag får många relevanta träffar som handlar om refraktorer i Stockholm eller dess närhet men jag får också enskilda träffar där ordet ”refraktor” inte har något att göra ”Stockholm”. De två sökorden är på samma tidningssida men i olika artiklar. De flesta träffar handlar alltså om Stockholm i ett visst sammanhang och en refraktor någon annanstans i världen. Om sökmotorn hade kunnat skilja på huruvida respektive sökord var i samma artikel eller inte skulle detta problem kunna undvikas. Lösningen, som jag inte vet hur den skulle kunna genomföras rent praktiskt vara att förfina sökmotorns artikel och rubrik indexering.
Den första träff jag får på sökordet ”refraktor” (En astronomisk kikare) är från ”Carlscrona weckoblad” den 10 maj 1828. Här rör det sig dock om en refraktor i Stauenhofer. Den första träffen som berör Stockholm är från den 23 september 1835 i tidningen ”Det nyare aftonbladet” och utgör därmed startpunkt för min databas som för närvarande sträcker sig fram till den 28 september 1941.
Mer om sökresultaten och annat i nästa inlägg.
/Otto