Bokscanner: Difference between revisions

From MakersLink
Jump to navigation Jump to search
LA2 (talk | contribs)
No edit summary
LA2 (talk | contribs)
No edit summary
Line 30: Line 30:
Bokscanning exempel 3.jpg|Bilden färgjusterad, något för hårt, stickar av åt rött
Bokscanning exempel 3.jpg|Bilden färgjusterad, något för hårt, stickar av åt rött
Bokscanning exempel 4.jpg|Mer måttlig färgjustering
Bokscanning exempel 4.jpg|Mer måttlig färgjustering
Bokscanning exempel 5.jpg|Lätt att skilja på å och ä, även i finstilt text
</gallery>
</gallery>



Revision as of 16:48, 11 December 2021

Att bygga en bokscanner är inte ett projekt som sätts igång och blir färdigt, utan en ständig process av små förbättringar. Den här sidan tar upp några delproblem och deras lösningar.

Vem gör något

Inom Makerspace Linköping
  • Lars Aronsson (LA2), som också har grundat Projekt Runeberg (nedan)
  • Martin A
Bokscanning-projekt
Bokscanners

Vad har scannats

December 2021
  • Almanack för alla, årgångarna 1910, 1922, 1923 - litet format, platta böcker, digitalkamera tar ett uppslag per bild

Problem och deras lösningar

Upphovsrätt

Upphovsrätten ger författaren ensamrätt på att bestämma över exemplarframställning och spridning av litterära verk i hela hans livstid och därefter i 70 hela år. Om flera upphovsmän är inblandade (författare, medförfattare, översättare, illustratörer) måste de enas om sina beslut. Hamlet av Shakespeare kan alltså vara upphovsrättsligt skyddad av översättaren och illstratören, trots att författaren är död sedan länge.

Scanna eller fotografera - en fråga om upplösning

Det finns bara en enkel huvudregel för upplösning: I bilden ska det lätt gå att se skillnad på punkt och komma, även i den mest finstilta texten. Många nybörjare tycker att 150 dpi (dots per inch) verkar ge en läsbar text. Men tittar man noga efter, krävs det att man ibland måste gissa om det står "e" eller "c" i bokens fotnoter. När man måste börja gissa och sedan kanske gå tillbaka till biblioteket för att se vad det verkligen stod i boken, så tappar man mycket av vinsten med bokscanning. Vid färgbilder (JPEG) är 300 dpi den lägsta användbara upplösningen. Vid svartvit scanning utan gråskalor (i filformatet TIFF G4, som ofta användes före år 2010) är 600 dpi en vanlig upplösning. Med modernare teknik används nästan alltid färgbilder, digitalkameror och en upplösning av 400 dpi eller högre.

Med desktop publishing (DTP) på 1990-talet blev flatbäddscannern vanlig. Den hade en linjär rad av fotoceller seriekopplade i en charge coupling device (CCD), ett sorts skiftregister, typiskt 600 dpi (fotoceller eller dots per inch), som en stegmotor svepte över en A4- eller A3-yta. Ett skrivpapper (A4/legal) är 8,5 tum brett och kräver alltså 5100 fotoceller i rad. På andra ledden (11 tum) krävs 6600 steg med stegmotorn, nedväxlade till 1/600 tum.

Ett alternativ till flatbäddscannern är en sidmatande scanner. Det kräver att man skär sönder boken och för en del böcker är detta realistiskt. Man kan då scanna fram- och baksidan samtidigt (duplex) och få en mycket rationell arbetsgång.

Digitala kameror har fotoceller i två dimensioner och för att täcka en A4 med 600 dpi krävs 5100 × 6000 pixels = 31 megapixel. Man kan nöja sig med 300 dpi = 8 megapixel. De första digitalkamerorna på konsumentmarknaden kom omkring år 2000 och hade 2 megapixel. På 2010-talet var 10 megapixel en vanlig upplösning och på 2020-talet 20 megapixel eller mer.

Fotografera platt eller i vinkel

En del böcker är tillräckligt böjliga för att kunna läggas platt på ett bord och tillräckligt små för att den kamera som används i tillräckligt fin upplösning ska kunna fånga ett helt uppslag, både vänster- och högersidan, i en bild.

För böcker där detta inte är möjligt, är det bättre att lägga boken på ett V-format underlag, en bokvagga, och låta två kameror fotografera varsin sida.

Glas eller inte
Belysning, ljusreflexer
Beskärning
Vitbalans, färgjustering