Bokscanner: Difference between revisions
No edit summary |
No edit summary |
||
| Line 30: | Line 30: | ||
Bokscanning exempel 3.jpg|Bilden färgjusterad, något för hårt, stickar av åt rött | Bokscanning exempel 3.jpg|Bilden färgjusterad, något för hårt, stickar av åt rött | ||
Bokscanning exempel 4.jpg|Mer måttlig färgjustering | Bokscanning exempel 4.jpg|Mer måttlig färgjustering | ||
Bokscanning exempel 5.jpg|Lätt att skilja på å och ä, även i finstilt text | |||
</gallery> | </gallery> | ||
Revision as of 16:48, 11 December 2021
Att bygga en bokscanner är inte ett projekt som sätts igång och blir färdigt, utan en ständig process av små förbättringar. Den här sidan tar upp några delproblem och deras lösningar.
Vem gör något
- Inom Makerspace Linköping
- Lars Aronsson (LA2), som också har grundat Projekt Runeberg (nedan)
- Martin A
- Bokscanning-projekt
- Internet Archive, https://archive.org/details/books
- Google Books, https://books.google.com/
- De flesta större bibliotek, till exempel Kungliga biblioteket i Stockholm och Linköpings stadsbibliotek, dock inte Linköpings universitetsbibliotek
- Wikisource, bokscanningsprojektet inom Wikimedia Foundation, t.ex. på svenska http://sv.wikisource.org/
- Projekt Runeberg, ett öppet webbarkiv av fri nordisk litteratur, hemmahörande hos föreningen Lysator vid Linköpings universitet, http://runeberg.org/
- Bokscanners
- DIY Bookscanner, https://diybookscanner.org/
- med användbart diskussionsforum, https://diybookscanner.org/forum/
- och översikt över byggsatser, https://web.archive.org/web/20210304010633/diybookscanner.org/en/designs.html
- Senaste byggsatsen Archivist Quill lanserades 2016 av Tenrec Builders i Salt Lake City, men produktionen inställdes dessvärre under pandemin 2020, http://tenrec.builders/
- Internet Archive har byggt sina egna stora bokscanner-stativ med namnet "Scribe" och även lanserat en table-top Scribe, https://archive.org/details/tabletopscribesystem
Vad har scannats
- December 2021
- Almanack för alla, årgångarna 1910, 1922, 1923 - litet format, platta böcker, digitalkamera tar ett uppslag per bild
Problem och deras lösningar
-
Foto av ett uppslag, två boksidor
-
Högra sidan utskuren. Bilden är något blåtonad och matt
-
Bilden färgjusterad, något för hårt, stickar av åt rött
-
Mer måttlig färgjustering
-
Lätt att skilja på å och ä, även i finstilt text
- Upphovsrätt
Upphovsrätten ger författaren ensamrätt på att bestämma över exemplarframställning och spridning av litterära verk i hela hans livstid och därefter i 70 hela år. Om flera upphovsmän är inblandade (författare, medförfattare, översättare, illustratörer) måste de enas om sina beslut. Hamlet av Shakespeare kan alltså vara upphovsrättsligt skyddad av översättaren och illstratören, trots att författaren är död sedan länge.
- Scanna eller fotografera - en fråga om upplösning
Det finns bara en enkel huvudregel för upplösning: I bilden ska det lätt gå att se skillnad på punkt och komma, även i den mest finstilta texten. Många nybörjare tycker att 150 dpi (dots per inch) verkar ge en läsbar text. Men tittar man noga efter, krävs det att man ibland måste gissa om det står "e" eller "c" i bokens fotnoter. När man måste börja gissa och sedan kanske gå tillbaka till biblioteket för att se vad det verkligen stod i boken, så tappar man mycket av vinsten med bokscanning. Vid färgbilder (JPEG) är 300 dpi den lägsta användbara upplösningen. Vid svartvit scanning utan gråskalor (i filformatet TIFF G4, som ofta användes före år 2010) är 600 dpi en vanlig upplösning. Med modernare teknik används nästan alltid färgbilder, digitalkameror och en upplösning av 400 dpi eller högre.
Med desktop publishing (DTP) på 1990-talet blev flatbäddscannern vanlig. Den hade en linjär rad av fotoceller seriekopplade i en charge coupling device (CCD), ett sorts skiftregister, typiskt 600 dpi (fotoceller eller dots per inch), som en stegmotor svepte över en A4- eller A3-yta. Ett skrivpapper (A4/legal) är 8,5 tum brett och kräver alltså 5100 fotoceller i rad. På andra ledden (11 tum) krävs 6600 steg med stegmotorn, nedväxlade till 1/600 tum.
Ett alternativ till flatbäddscannern är en sidmatande scanner. Det kräver att man skär sönder boken och för en del böcker är detta realistiskt. Man kan då scanna fram- och baksidan samtidigt (duplex) och få en mycket rationell arbetsgång.
Digitala kameror har fotoceller i två dimensioner och för att täcka en A4 med 600 dpi krävs 5100 × 6000 pixels = 31 megapixel. Man kan nöja sig med 300 dpi = 8 megapixel. De första digitalkamerorna på konsumentmarknaden kom omkring år 2000 och hade 2 megapixel. På 2010-talet var 10 megapixel en vanlig upplösning och på 2020-talet 20 megapixel eller mer.
- Fotografera platt eller i vinkel
En del böcker är tillräckligt böjliga för att kunna läggas platt på ett bord och tillräckligt små för att den kamera som används i tillräckligt fin upplösning ska kunna fånga ett helt uppslag, både vänster- och högersidan, i en bild.
För böcker där detta inte är möjligt, är det bättre att lägga boken på ett V-format underlag, en bokvagga, och låta två kameror fotografera varsin sida.
- Glas eller inte
- Belysning, ljusreflexer
- Beskärning
- Vitbalans, färgjustering