Change language:
>English
>Dansk
Please note! The danish version vil contain more references than the english menu |
Billedlagring i slægtsforskning2. udgave
©1999-04-15 Erik Bachmann
IntroduktionIntentionen med denne artikel er at give en kortfattet introduktion til digital billedlagring - ikke billedbehandling i form af billedmanipulation.Tekniske udtryk er forsøgt udeladt, for ikke at ende i bit-fedteri og diskussioner om profetens skæg. Ligeledes er der ingen omtaler/anbefalinger af specifikke programmer. Det er læserens opgave at vælge frit.
Artiklen er skrevet fordi der ustandselig kommer spørgsmål angående de
samme problemer, som jeg selv har kæmpet med. Der er ikke mig bekendt
noget kortfattet dansksproget materiale indenfor dette område.
I artiklen støtter jeg mig meget til Wayne Fultons fremragende bog "A few scanning tips"
(www.scantips.com).
Har du kommentarer eller forslag til denne arktikel hører jeg gerne nærmere.
Indhold
FormålInden man giver sig i kast med de følgende kapitler, er det en nødvendighed at gøre sig klart, med hvilket formål man ønsker at digitalisere sine billeder.Undervejs i processen må man nødvendigvis træffe nogle valg, som senere kan vise sig at være skæbnesvangre - især hvis man træffer de forkerte valg. Formål med digitaliseringen kan være:
Hver af de ovenstående mål stiller vidt forskellige krav til metode og medie.
LæseudstyrTil selve affotograferingen af billeder, genstande og dokumenter kan man anvende digitale kameraer eller scannere.Digitalt kameraNyest på markedet er det digitale kamera. Dette er glimrende til portrætter af personer, billeder af bygninger, inventar fra rytterstatuer til nipsenåle. De er dog ikke velegnede til gengivelser af dokumenter og affotografering af andre fotografier. Dette vil kræve professionelle fotolaboratorier og højere opløsning end teknisk muligt i dag.ScannereEr i princippet fotodelen af en fotokopimaskine: en fotosensor bevæges henover originalen, imedens denne belyses af en kraftig lampe. Fotosensorens "oplevelser" gemmes som en digital (binær) kode. og vupti har man en digital kopi.Scannere er i dag tilgængelige for menigmand til priser fra få hundrede kroner og opad - tilsyneladende uden øvre grænse. Teknisk set er der tre hovedtyper, der fortjener en nærmere beskrivelse: Håndscannere, rullescannere og fladscannere.
Håndscannere![]()
Rullescannere![]() Denne form for scannere fremhæves ofte i forbindelse med optisk skriftgenkendelse (OCR). De giver ofte meget høj opløselige kopier til en billig penge.
Desværre er der een vægtig ulempe: Rullerne.
Fladscannere![]() Fladscannere minder mest om den konventionelle fotokopieringsmaskine. Originalen lægges på en glasplade med forsiden nedad og den dækkes med et låg inden selve kopieringen.
Ulemperne er at de ofte er klodsede, langsomme og at originalerne let
forskubber sig, når låget lægges på.
Velegnet til ukorrente objekter som fotografier på karton, breve og skæve fotografier, der skal efterbehandles ved fx beskæring. Lagerstørrelser og farverLidt matematikLad os tage et eksempel: Et fotografi ca. 10 * 15 cm. (Det er let at regne med)Edb-verdenen er om ikke anglofil, så dog amerikaniseret i en grad, at engelske mål og enheder er mere reglen end undtagelsen. Alle optiske mål angives i engelske tommer eller rettere punkter pr. tomme (Dot per inch) eller dpi, hvor en 1" (tomme) er lig med 2,54 cm. Dette giver en billedstørrelse på 3.94 * 5,91". For at holde jordforbindelsen runder vi af og siger at billedet er ca. 4 * 6 " (10,16 * 15,24 cm). Inden tråden tabes helt kommer et par eksempler på hvor meget digitale billeder fylder. WWW og skærmEn attraktiv billedopløsning til WWW og anden skærmbrug er 75 dpi. I denne opløsning vil billedet fylde:( 4" * 75 dpi ) * ( 6" * 75 dpi ) = 135.000 punkter.
Gråtone billederHvor meget fylder billedet så? For hvert punkt skal man have en farve/kontrast værdi. Simple sort/hvide billeder (grafisk set: gråtone billeder) kan lageres med kun 8 bit kontrast information (= 256 gråtoner). Dette betyder at hvert punkt på billedet fylder 1 byte (eet tegn). Billedet vil altså fylde 135.000 bytes i lageret.På disken afhænger størrelsen af filformatet, men herom senere. Ægte farverEr det et farvebillede, bliver beregningen lidt mere kompliceret. For at lave farver med ægte glød og klarhed skal farvespektret helt op på 24 bit (16,8 millioner farver) eller rettere farve, lys og kontrast kombinationer.Et sådan billede vil fylde 3 gange så meget som et 8 bit gråtone billede, idet 8 bit = 1 byte = eet tegn og 24 bit = 3 byte = 3 tegn eller i alt 405.000 byte. På engelsk kaldes 24 bit farve også for "True color" altså "ægte farve".
Høj farveopløsningMindre farvelade kan naturligvis gøre næsten det samme. Vælger man 16 bit farve med ca. 32.000 farvekombinationer fylder billedet "kun" dobbelt så meget som et gråtone billede nemlig 270.000 byte. Naturligvis med et betydeligt tab af farvenuancer.På engelsk kaldes 16 bit farve også for "High color" altså "høj farveopløsning".
Simple farver"I gamle dage" kunne man nøjes med 256 farver (8 bit), altså samme størrelse som gråtone billedet på 135.000 byte. Farverne vil dog på ingen måde yde originalbilledet retfærdighed. Denne farveopløsning egner sig IKKE til fotografier, men kan anvendes til tegninger og andre grafiske illustrationer med et begrænset farvespektre og hvis indhold ikke stiller store krav til farveægtheden.
MonokromMonokrom eller "Stregtegning" (1 bit ægte sort/hvid) anvendes til konturindeks og tekstdokumenter, der gør sig bedst uden gråtoner. Fylder kun ganske lidt i forhold til farve og gråtone billeder. Eksempelvis fylder billedet på 135.000 punkter kun 16.875 bytesOm "ægte farver" virkelig også er naturtro afhænger naturligvis af øjnene, som ser; men i højeste grad også af de udstyr, som anvendes: Både scanner, programmel og skærmen resultatet skal vises på.
Og hvad skal man så med den viden?Jo - afgøre fra starten hvilken:
Hvis man derimod gerne vil lave kopier til brug på internettet eller bare
til "skærmbrug", bør man holde igen med farveladen og moderere
opløsningen. Det fylder og det kræver meget af både brugerens skærm,
disk - og evt. modem.
På samme vil bør man holde sig til at lave opløsninger på billeder. en almindelig VGA skærm svarer groft talt til 75 dpi. Højere opløsninger giver ofte et ringere resultat pga. skærmens forvanskning og begrænsede størrelse. Hvis man ønsker at lave papirkopier af sine billeder er det værd at huske på at 300 dpi eller 600 dpi er maksimalt opløsning for de almindelige printere i dag. Et 2400 dpi billede skal altså "presses" ned i en lavere opløsning ved udskrivning. Dette tager dels tid, dels øger det risikoen for et betydeligt kvalitetstab. Optisk kontra interpoleret opløsningMed hensyn til opløsning skal man vide hvilken optisk opløsning scanneren har. Oftest oplyser producenten/forhandleren en interpoleret opløsning.Forskellen ligger populært sagt i at ved optisk opløsning svarer eet punkt læst til eet punkt lagret. Ved interpolering læses nogle punkter, hvorefter der indsættes nogle fyldpunkter med en beregnet ca. værdi. Interpolering får billedet til at se større ud, men giver ofte et tåget og uskarpt billede. Hvis en scanner fx. har en optisk opløsning på 300 * 600 og en interpoleret opløsning på 600 * 1200 vil den maksimale rene opløsning være 300 * 600. Bruger man 600 * 1200 får man blot et 300 * 600 billede forstørret op ved at hvert andet punkt i billedet er udfyldt med en ca værdi. Lad os tage et eksempel, hvor lysintesiteten angives som en værdi imellem 0 og 200, hvor 000 er sort og 200 hvid. |100|150|200|000|200| ____/ // /| |\ \\ \_____ / ____// / | | \ \\____ \ / / _/ / | | \ \_ \ \ ( ) ( ) ( ) ( ) ( ) |100|125|150|175|200|100|000|100|200| ^^^ ^^^ ^^^ ^^^ Bemærk at den ene sorte plet (000) som ligger imellem 2 hvide pletter (200) bliver til faktisk til tre punkter (100, 000, 100), hvilket vil give et uskarpt billede. LagerDen første gang jeg sad med en kopi af et sort/hvid billede, som fyldte 85 MB fik jeg lidt af et chok - hvor i alverden triller man sådan en moppedreng hen?Lager kan her være en af tre ting:
Internt lagerPc'en skal nødvendigvis have en vis kapacitet for at kunne rumme de enorme datamængder, som billeder er. Moderne styresystemer bruger oftest disken som en "forlængelse" af de interne lager. Dette gør de muligt at arbejde med billeder, der er langt større end det fysiske interne lager. Løsningen er dog langsom.Langt at foretrække er den moderne multimedie PC med tilstrækkeligt kapacitet til at håndtere hele billedet i det interne lager. Der kan være tale om over 100 MB - en størrelse, der godt kan give pletter for øjnene, hvis man forsøger at forholde sig nærmere til den. FastdiskFastdisken er der hvor man midlertidigt gemmer sine billeder. Her er de bekvemt ved hånden under scanning, registrering, efterbehandling osv.Desværre er diskkapaciteten begrænset. Det er nok de færreste, der kan have hele familiealbummet på Pc'en. Det ideelle er nok at kunne lagre og redigere tilstrækkeligt store mængder af data til senere at kunne overføre en "færdigpakke" til et mere permanent medie. Permanent lagermedieEt permanent medie SKAL være et holdbart medie, gerne med stor kapacitet og hurtig tilgang til data.Mediet kan være magnetbånd, magnetdiske (Zip, Jazz osv.) eller optiske diske (CD-ROM, CD-RW, DVD). For tiden er det bedste bud på et godt lagermedie en CD-ROM.
I løbet af et års tid eller to vil DVD (Digital Versatile Disc) komme ind på markedet. DVD ligner fysisk CD-ROM'en, men har en lager kapacitet på over 5 GB eller næste det ni dobbelte af CD-ROM'ens kapacitet. Prisen er dog endnu meget høj. FilformaterNår oldemor er blevet digitaliseret, skal hun også gemmes. Det er bestemt ikke ligegyldigt i hvilket format billederne gemmes.Der anvendes flere hundrede forskellige filformater, der stort set enhver programproducent har genopfundet tallerkenen. Nogle er obskure rariteter, der måske kun kan læses af et enkelt program. Andre anvendes bredt og har fået status af industristandarder - uden at der i øvrigt skal lægges for meget i ordet "standard".
Nogle af de mest udbredte formater er: BMP (Windows Bitmap)Er et Windows specifikt format. Kan gemme 24 bit farveformat, men uden kompression. Billederne vil fylde enormt og kan typisk kun vises af Windows baserede maskiner.Udemærket til mindre grafik, der kan komprimeres med RLE (Run Length Encoding), men er uegnet til fotografier. GIF (Graphic Interchange Format)er et gammelt format udviklet sidst i 80'erne af Compuserve. Et gedint format med alle de faciliteter man kunne ønske sig - dengang.
Hvert billeder har sin egen farvepalette, hvilket kan give en god farvedybde og et realistisk billede. Desværre giver denne selvstændig farvepalette problemer ved visning i nogle programmer (fx. Netscape klienter), hvor billederne kan virke "grynede" pga. konflikter med programmets faste farvepalette. GIF er dog stadig et godt format til Web-sider og især grafik. GIF er dog bestemt ikke egnet til originalbilleder (masterkopier) pga. begrænsningerne i antal farver og problemerne med farvepaletten. JPEG (Joint Photograpic Experts Group) eller JPGer et format med meget høj farveopløsning (min. 16 bit / 32.000 farver) og en utrolig effektiv kompression. Formatet er fremragende til Web-sider, da billederne kun fylder ganske lidt og alligevel har meget høj farveopløsning.Desværre har alting en pris: Kompressionen smider data væk !!!! Hver gang man gemmer billedet tabes der information ved rekomprimeringen. Billedet bliver altså mere og mere utydeligt for hver gang der gemmes.
Eksempel på datatab i JPEG
Brug formatet til farveægte kopier på Web-sider og til e-post - ikke til originaler. PCX (Windows Paintbrush)Igen en Windows specialitet. Billeder fylder meget og kan kun vises på Windows baserede maskinerBrug et andet format. PNG (Portable Network Graphics)er afløseren for GIF med allehånde tekniske finesser indbygget. Der er nogle vigtige aspekter:
Dog er formatet forholdsvis nyt. Ældre billedbehandlingsprogrammer kan måske ikke læse/skrive i formatet. Et godt og velment råd: Opgrader eller skift til programmer, der kan håndtere PNG. TIFF (Tagged Image File Format) eller TIFer et universal format udviklet af Aldus (i dag Adobe). Formatet kan anvendes på tværs af stort set alle platforme (PC, Mac, Amiga, Unix, OS/2) og er et af de mest udbredte formater til foto og grafik.TIFF findes både med og uden kompression. Kompressionen er af typen LZW og er uden datatab. Desværre fylder selv komprimerede TIFF-filer uforholdsvis meget. Ukomprimerede TIFF-filer er kun for folk med for meget diskplads ;-) Summa summarum:
Originalbilledet er 4 * 6". Størrelserne ved filformaterne er angivet i tegn (byte).
*2) TIFF 300 dpi *3) kompression = LZW
Hvilke programmer skal man bruge?Til scanning og elementær behandling (tilskæring) af billeder, man sagtens bruge mange af de gratis programmer, der i dag bliver leveret sammen med scannerne.Oftest ligger den avancerede del af teknikken gemt i de styreprogrammer (drivere), som producenten har udviklet til at styre scanneren med. Er det de mere avancerede lyster med farve- og kontrastændringer eller retouchering af beskadigede billeder, bør man nok kigge på de halv- eller hel professionelle billedbehandlingsprogrammer. Det er uendeligt svært at rådgive om, hvilket program man skal vælge. Mange har et næsten religiøst forhold til netop deres favoritprogram. Mine råd er:
Opbevaring af billederSom de fleste har bemærket, holder moderne fotografier ikke særligt godt i fotorammer og i plastikalbum.Væsentligst fordi fotografier har tre fjender: Lys, syre og fugt.
OCR (Optical Character Recognition)"C'est ne pas une pipe" skrev surrealisten Magritte på et billede af en pibe. Det samme gælder for billeder af dokumenter: Man kan ikke lave tekstbehandling eller søgninger i teksten.Visse typer af dokumenter kan, hvis de er af god kvalitet og med fast ensartet typografi (bog- og avistryk eller maskinskrevet), fortolkes fra billeder til tekstdata. Processen kaldes ofte for OCR eller ICR (Intelligent Character Recognition).
Hov! Er det her ikke billedbehandling i stedet for billedlagring???
I praksis forsøger programmet at sammenligne nogle kendte figurer
(bogstaver og tal) med det billede, der scannes ind.
Er OCR overhovedet anvendelig for slægtsforskere?
Og hvad gør han selv?Den mest besværlige løsning. Efter en del eksperimenter er jeg kommet frem til følgende model.Billederne scannes i to opløsninger:
I en tidligere udgave tillod jeg mig frit og frejdigt at foreslå scanning i 2400 dpi i reprokvalitet. Kvaliteten kunne dog ikke stå for en nærmere prøve. Overvurder ikke din scanners kvalitet. Se også afsnittet: Optisk kontra interpoleret opløsning Udfra 75 dpi billederne laves yderligere to billeder:
Til sidst indsættes et bogstav på eller ved hver enkelt omrids på billedet. Billedbehandlingsprogrammer har ofte to funktioner til at ændre størrelse på billeder:
For at kunne holde styr på billederne og deres indhold registreres en række oplysninger for hvert enkelt billede i en database
Eksempler:
Databasen er i mit tilfælde en flad tekstfil og indekserne udtrækkes vha. et script i Perl. Referencer"A few scanning tips" (www.scantips.com) / Wayne Fulton.Bogen giver en eminent og teknisk velfunderet gennemgang af dette område på engelsk. Bogen kan læses gratis på internettet og kan stærkt anbefales. DIS - Databehandling I Slægtsforskning http://users.cybercity. dk/~dko6959/ Genealogy Resource Index for Denmark, GRID http://www.purl.dk/net/9712- 0110 DIS-Norges program- og filservice for slektsforskere http://www.sol.no/disnorge/program.htm Color Scanning Handbook http://www.scanjet.hp.com/workshop/tips/. Udvalgte tips om scanning.
|
#>>> Debug information ---------------------------------------------- Latest update: [] Debug: [] #<<< Debug information ---------------------------------------------- |