Lad os se hvordan man digitaliserer en bog på en meget hurtig og hjemmelavet måde.
Digitalisering af en bog består altid af to dele, den første hvor du får et billede af teksten og den anden hvor dette billede behandles med en OCR, har en Optisk karaktergenkendelsessoftware
Traditionelt blev bøger scannet side for side, dette er en meget langsom proces, der var kompleks på grund af bøgernes rygsøjler, som buede siderne, og derefter genkendte OCR ikke ordene godt. Det blev bemærket, at mange mennesker ubundne dem for at lette scanningen.
Så i stedet for at scanne siderne skal vi tage billeder af det. Jeg arbejder med et kompakt kamera på 10 megapixel, men det kan endda gøres med en smartphone.
Som du kan se, er det et meget hjemmelavet og billigt system, men alligevel havde jeg på mindre end en time en 120-siders bog i digitalt format (uden layout) og uden at skynde mig.
Og tro ikke, at dette kun bruges til piratbøger, at du kan bruge det perfekt til at digitalisere dine klassenoter og være i stand til at studere med en læser, ipad eller bærbar computer.
System til digitalisering af en bog
Vi har brug for det
- Et fotokamera
- Et stativ
- Pap og tape
- En krystal
Den første ting at gøre er at bygge en platform eller talerstol til at rumme bogen, og vi skal gøre det med pap. Det er meget simpelt
I det senere skud værdsættes delene, der er forbundet med tape, bedre, bortset fra stropperne, der skaber stivhed i strukturen, så vi fjerner de 2 pinde, og vi kan folde talerstolen og opbevare den uden at optage
rygsøjlen er vigtig. Afhængigt af bogens tykkelse skal vi tilpasse den, så bogen ikke er federe og ikke har problemer.
Hvis du vil have alt tygget her, efterlader jeg dig målingerne af den, jeg har bygget. Det går i cm, og x2, x4 er det antal stykker, du har brug for af hver enkelt
Samling af bogens digitaliseringsenhed
Vi bruger glasset til at flade ud siden for at fotografere, skal du være forsigtig med glassets refleksioner, så det er bedst at gøre det med naturligt lys, og det falder fra siden.
og du skal placere kameraet, så det tager hele siden, så tæt som muligt (brug zoom) og så centreret som muligt.
Som vi har sagt, er glasset ansvarligt for at lade arket blive fotograferet fladt, vi vil flytte den modsatte side væk, så det ikke vises på skærmen og lade det fotografere al teksten.
Hvis du ser på dette fotografi, ville det være dårligt udført, fordi det ikke tager den fulde tekst
Alle margener skal være synlige, du kan ikke klippe ordene, så det er meget vigtigt at placere kameraet godt for at få billederne
Hvordan tager jeg billederne?
[fremhævet] Jeg opdaterer redigering af billederne trin for trin, hvilket er et punkt, der ikke er klart, og mange af jer spørger mig [/ fremhævet]
Der er flere metoder og software, der kan hjælpe os. For mig er den hurtigste og mest behagelige ting først at fotografere de ulige sider og derefter gøre de lige.
Vi omdøber dem med sidetalene for at kunne blande dem, dette kan gøres med flere gratis software.
Og hvis du vil, kan du rotere en af de 2 batches, enten de ulige eller lige, fordi de vil blive justeret i modsatte retninger, og afhængigt af den OCR, du bruger, kan du have problemer med at identificere teksten.
Sådan roteres billeder med GIMP
Vi bruger GIMP, den gratis softwarebillededitor og et plugin kaldet BIMP, der er vant til batch redigere billeder. Her er en video af, hvordan det ville blive gjort
Hvad er en OCR?
Vi er i det sidste trin. køre billeder gennem OCR. OCR er en optisk karaktergenkendelsessoftware, som det, den gør, er genkende tekst i et billede og konvertere den til skrevet tekst som du kan gemme som et tekstdokument, enten .doc .odt eller i andre formater.
Det bedste, jeg kender, er Abby fin læser et rigtig vidunder, men det er betalt.
Når alt er blevet digitaliseret, "kun" skal vi lave layoutet, men vi vil ikke tale om dette for nu, medmindre det interesserer mange af jer.
Endelig, da sikkert nogen prøver at se, hvilke bøger der var i stakken, her er en detalje ;-)
Verdens hurtigste digitaliseringsbog
Hvordan jeg ved, at du kan lide trivia her fra en video af driften af verdens hurtigste bogdigitizer. Det er BSF-Auto og er i stand til at scanne 250 sider i minuttet
Du har flere oplysninger på http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/
Tak fordi du delte denne gode idé, jeg er en af dem, der river papiret i stykker for at scanne det, da det er en grund til plads, det har ikke været et stort tab, men jeg har også andre kopier, som jeg ikke ønsker at slippe af med af og hvis jeg digitaliserer dem, tak igen.
Jeg er glad for, at ideen fungerer for dig, og du kan holde dine fysiske volumener intakte ;-)
Hvis du kan tænke på nogen forbedring, er det altid velkomment.
hilsener
Fremragende idé.
Jeg tror, at vejledningen formår at kommunikere, men den mangler stadig en masse data, så enhver dødelig elendighed kan gøre, hvad den er beregnet til at undervise her.
Hej,
Jeg troede, det var meget klart :-(
Fortæl mig, hvad du er i tvivl om, og fuldfør vejledningen.
hilsener
Jeg leder efter en support, købt eller bygget til mobil samsung note II. Jeg har brug for det til at scanne bøger og klare kameraer. Det vil sige lodrette, skrå og vandrette positioner.
Hej, meget god tutorial og meget original måde, det er simpelt for dem, der ikke har en scanner. Jeg beder om tilladelse til at linke det fra min blog.
Greetings.
Hej Roland.
Intet problem, tværtimod, linkene værdsættes :)
hilsener
Tak, nu beder jeg tilladelse til at kopiere hele teksten på bloggen, hehehe ... naturligvis respekterer dit forfatterskab og links.
Greetings.
Vær hilset. God forklaring og bidrag, normalt scanner jeg det, men som du siger undertiden kommer ordene ikke helt ud, og det er langsommere. Held
der er et gratis ocr-program gratis ocr. Det er ikke mælk, men det klarer sig ganske godt
Mange tak for henstillingen
Jeg vil bevise det for at se det :)
Det ser godt ud, jeg vil prøve at ændre det og gøre det mere effektivt, jeg har nogle bøger, som jeg gerne vil konvertere til pdf: D
Ifølge Romodolfo mangler programmets navn for at integrere de lige og ulige sider, så det ville være meget komplet en eller anden gang, vi foretrækker at tygge altid takket være et kram
For dem der ikke er vant til at administrere billedserier, er omdøbning og blanding af lige og ulige fotos forvirrende.
Hvis du kunne detaljer det lidt mere, ville det være fint.
Hvis du har brug for et program til at omdøbe lige og ulige sider, er en enkel, som jeg kan anbefale, "Lupas Rename 2000", som du nemt kan finde med google.
Når jeg har scannet bøger, og da min scanner kun scannede den ene side, scannede den først de ulige sider og derefter lige sider, og med det lille program omdøbes de på et øjeblik.
En hilsen.
For OCR fungerer One Note fint, der er "tutorials" om, hvordan du gør det:
Officeren er her
Jeg håber det hjælper dig, læreren vil tjene mig "lidt" hahaha.
hilsen
Jeg har brug for at bygge et hjemmelavet lucida-kamera.
tak
lucida kamera
Tak for dit input. Nå, det er en ødsel kamel (arbejde). Tak bror.
Nu er historien at sætte glasset på universitetet, ha ha
Hej, meget interessant. Jeg har en semi-professionel refleks (en nikon!) Og nu ved jeg hvad jeg skal bruge til den, hehehe
Men jeg har et forslag. Du siger "brug din hånd til at flade det ark, der ikke skal fotograferes." Og hvorfor ikke bruge en anden plade af noget hårdt materiale? I så fald kan du lave en slags mappe (godt monteret og limet, så den ikke adskilles) i form af en to-siders bog, og du lægger dem oven på bogen for at blive fotograferet. En af siderne eller arkene i mappen vil være noget hårdt materiale; og det andet det glasflade, du bruger til at tage billedet, på den side, der interesserer dig.
Jeg siger.
Tak for ideen.
Hej, mange tak for kommentaren
ja det er en meget god idé, sandheden er, at den metode, jeg efterlod, er meget meget grundlæggende, at digitalisere en bog. Hvis du vil gøre en masse volumen, skal vi foretage et par ændringer for at kunne gå hurtigere :)
hilsener
Tak, jeg reserverer! Jeg ville også spørge dig, og hvis der er billeder eller grafik, hvordan gør jeg det? Er billederne integreret som det ses i teksten? Eller hvordan skal jeg gøre, hvis jeg har tekst og billeder på en side?
Godnat.
Jeg elskede dit indlæg. Tillykke.
Jeg siger ikke, at jeg har opnået det, fordi jeg har været i det næstsidste trin: Layoutet.
Søn, jeg har ønsket at skære mine årer hundrede gange, hvad siger jeg hundreder! TENS !!!
Ingen sjov, du ville gøre mig en kæmpe tjeneste, hvis du fortalte os om layoutprocessen. Dette ville fuldføre processen fra en enkelt kilde.
Jeg opfordrer dig til at gøre det.
Endnu en gang tillykke.
Sandheden er, at supporten og kameraet er en god idé, men jeg er i tvivl om at scanne de lige først og derefter de ulige og omordne dem, da jeg tror, det ville tage lang tid at gøre det manuelt eller at lære at bruge programmet hehe
Du siger også, at efter at have taget billedet konverteres det til tekst, som ikke ligner en fotokopi, så for billeder eller tekstfelter, som det ville være, hvis du kunne give det endelige resultat bedre.
Efter din mening er det bedre med flash eller uden flash i et rum med normalt dagslys med en mobiltelefon (8Mpx)?
Tak
Hej Eugenia, jeg personligt foretrækker et kamera, der løser lyset, der skal bruges ganske godt. Hvis det er et mobiltelefonkamera, anbefaler jeg normalt dagslys, men ikke direkte. Efter et hvidt gardin, der diffunderer indgangslampen eller med eftermiddagslyset - i et rum på den modsatte side fra hvor solen går ned, da blitzen kan "brænde" billedet (det vil sige, det kan komme meget hvidt ud) .
Under alle omstændigheder er den bedste mulighed at sende fotografiet - anbefalet JPEG-format - gennem et OCR-scanningsprogram. Normalt løser disse programmer problemerne for dig.
Hvis du bruger glas til at udjævne arkene, tillader flashen ikke, at billedet tages, fordi det reflekteres. I normalt dagslys skal det være mere end nok.
så længe billederne er skarpe, fungerer OCR meget godt og registrerer alt
Hej! Jeg vil gerne vide, om du har et fotograferet ark for at se, hvordan det ser ud, da kameraet ikke sætter stor pris på det, ser det ud til, at arket ikke er komplet.
Dette billede er ikke klart, du skal tage al teksten. Det, der ikke ses i billedet, vil ikke blive transformeret af ocr, så ingen ord skal klippes. Jeg tager et billede og uploader det
Tillykke, jeg kunne virkelig godt lide ideen, jeg læste en kommentar, hvor jeg kunne støtte det ark, der fotograferer os. For eksempel kunne du lægge et skalpapir (tykt pap) fastgjort i bunden af glasset, som ville ligne en mappe, og det ville hjælpe med at gøre det lidt hurtigere, kunne det være?
Hvis du rammer billedet godt, så det tager al teksten på arket, og du bare ikke har brug for pap, fungerer det lige så hurtigt. Hvis du har svært ved at indramme, kan det være en god idé.
Tak Nacho for vejledningen.
Når du scanner en gammel bog, bliver arkene gule, beskidte, er der nogen måde at rense dem på?
hensyn
Hej Antonio. Hvis du vil sende det gennem OCR, er du ligeglad, fordi det kun holder teksten.
Hvis du vil generere en pdf fra scannede billeder, kan du redigere dem ved hjælp af Photoshop eller GIMP.
Mange tak for din hjælp, det har været meget nyttigt.