Sådan digitaliseres en bog

Lad os se hvordan man digitaliserer en bog på en meget hurtig og hjemmelavet måde.

Digitalisering af en bog består altid af to dele, den første hvor du får et billede af teksten og den anden hvor dette billede behandles med en OCR, har en Optisk karaktergenkendelsessoftware

Digitaliser bøger til e-bøger

Traditionelt blev bøger scannet side for side, dette er en meget langsom proces, der var kompleks på grund af bøgernes rygsøjler, som buede siderne, og derefter genkendte OCR ikke ordene godt. Det blev bemærket, at mange mennesker ubundne dem for at lette scanningen.

Så i stedet for at scanne siderne skal vi tage billeder af det. Jeg arbejder med et kompakt kamera på 10 megapixel, men det kan endda gøres med en smartphone.

Sådan digitaliseres en bog derhjemme

Som du kan se, er det et meget hjemmelavet og billigt system, men alligevel havde jeg på mindre end en time en 120-siders bog i digitalt format (uden layout) og uden at skynde mig.

Og tro ikke, at dette kun bruges til piratbøger, at du kan bruge det perfekt til at digitalisere dine klassenoter og være i stand til at studere med en læser, ipad eller bærbar computer.

System til digitalisering af en bog

Vi har brug for det

  • Et fotokamera
  • Et stativ
  • Pap og tape
  • En krystal

Den første ting at gøre er at bygge en platform eller talerstol til at rumme bogen, og vi skal gøre det med pap. Det er meget simpelt

talerstol til digitalisering af bøger

I det senere skud værdsættes delene, der er forbundet med tape, bedre, bortset fra stropperne, der skaber stivhed i strukturen, så vi fjerner de 2 pinde, og vi kan folde talerstolen og opbevare den uden at optage

hvordan man laver en pappult

musik hvile og støtte stykker

rygsøjlen er vigtig. Afhængigt af bogens tykkelse skal vi tilpasse den, så bogen ikke er federe og ikke har problemer.

talerstol digitaliser bog med kamera

talerstol rygsøjle detaljer

Hvis du vil have alt tygget her, efterlader jeg dig målingerne af den, jeg har bygget. Det går i cm, og x2, x4 er det antal stykker, du har brug for af hver enkelt

Planlæg at bygge talerstol og digitalisere bøger

Samling af bogens digitaliseringsenhed

Forsamling for at digitalisere bøger

Vi bruger glasset til at flade ud siden for at fotografere, skal du være forsigtig med glassets refleksioner, så det er bedst at gøre det med naturligt lys, og det falder fra siden.

og du skal placere kameraet, så det tager hele siden, så tæt som muligt (brug zoom) og så centreret som muligt.

oprettelse af e-bøger med et kamera

Som vi har sagt, er glasset ansvarligt for at lade arket blive fotograferet fladt, vi vil flytte den modsatte side væk, så det ikke vises på skærmen og lade det fotografere al teksten.

Hvis du ser på dette fotografi, ville det være dårligt udført, fordi det ikke tager den fulde tekst

billeder til okt

defekt side til okt

Alle margener skal være synlige, du kan ikke klippe ordene, så det er meget vigtigt at placere kameraet godt for at få billederne

Hvordan tager jeg billederne?

[fremhævet] Jeg opdaterer redigering af billederne trin for trin, hvilket er et punkt, der ikke er klart, og mange af jer spørger mig [/ fremhævet]

Der er flere metoder og software, der kan hjælpe os. For mig er den hurtigste og mest behagelige ting først at fotografere de ulige sider og derefter gøre de lige.

Vi omdøber dem med sidetalene for at kunne blande dem, dette kan gøres med flere gratis software.

Og hvis du vil, kan du rotere en af ​​de 2 batches, enten de ulige eller lige, fordi de vil blive justeret i modsatte retninger, og afhængigt af den OCR, du bruger, kan du have problemer med at identificere teksten.

Sådan roteres billeder med GIMP

Vi bruger GIMP, den gratis softwarebillededitor og et plugin kaldet BIMP, der er vant til batch redigere billeder. Her er en video af, hvordan det ville blive gjort

Hvad er en OCR?

Vi er i det sidste trin. køre billeder gennem OCR. OCR er en optisk karaktergenkendelsessoftware, som det, den gør, er genkende tekst i et billede og konvertere den til skrevet tekst som du kan gemme som et tekstdokument, enten .doc .odt eller i andre formater.

Det bedste, jeg kender, er Abby fin læser et rigtig vidunder, men det er betalt.

Når alt er blevet digitaliseret, "kun" skal vi lave layoutet, men vi vil ikke tale om dette for nu, medmindre det interesserer mange af jer.

Endelig, da sikkert nogen prøver at se, hvilke bøger der var i stakken, her er en detalje ;-)

eksperimentbøger og DIY

Verdens hurtigste digitaliseringsbog

Hvordan jeg ved, at du kan lide trivia her fra en video af driften af ​​verdens hurtigste bogdigitizer. Det er BSF-Auto og er i stand til at scanne 250 sider i minuttet

Du har flere oplysninger på http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/

35 kommentarer til "Sådan digitaliseres en bog"

  1. Tak fordi du delte denne gode idé, jeg er en af ​​dem, der river papiret i stykker for at scanne det, da det er en grund til plads, det har ikke været et stort tab, men jeg har også andre kopier, som jeg ikke ønsker at slippe af med af og hvis jeg digitaliserer dem, tak igen.

    svar
  2. Jeg er glad for, at ideen fungerer for dig, og du kan holde dine fysiske volumener intakte ;-)

    Hvis du kan tænke på nogen forbedring, er det altid velkomment.

    hilsener

    svar
  3. Jeg tror, ​​at vejledningen formår at kommunikere, men den mangler stadig en masse data, så enhver dødelig elendighed kan gøre, hvad den er beregnet til at undervise her.

    svar
  4. Jeg leder efter en support, købt eller bygget til mobil samsung note II. Jeg har brug for det til at scanne bøger og klare kameraer. Det vil sige lodrette, skrå og vandrette positioner.

    svar
  5. Vær hilset. God forklaring og bidrag, normalt scanner jeg det, men som du siger undertiden kommer ordene ikke helt ud, og det er langsommere. Held

    svar
  6. Det ser godt ud, jeg vil prøve at ændre det og gøre det mere effektivt, jeg har nogle bøger, som jeg gerne vil konvertere til pdf: D

    svar
  7. Ifølge Romodolfo mangler programmets navn for at integrere de lige og ulige sider, så det ville være meget komplet en eller anden gang, vi foretrækker at tygge altid takket være et kram

    svar
  8. For dem der ikke er vant til at administrere billedserier, er omdøbning og blanding af lige og ulige fotos forvirrende.

    Hvis du kunne detaljer det lidt mere, ville det være fint.

    svar
  9. Hvis du har brug for et program til at omdøbe lige og ulige sider, er en enkel, som jeg kan anbefale, "Lupas Rename 2000", som du nemt kan finde med google.

    Når jeg har scannet bøger, og da min scanner kun scannede den ene side, scannede den først de ulige sider og derefter lige sider, og med det lille program omdøbes de på et øjeblik.

    En hilsen.

    svar
  10. For OCR fungerer One Note fint, der er "tutorials" om, hvordan du gør det:

    Officeren er her

    Jeg håber det hjælper dig, læreren vil tjene mig "lidt" hahaha.

    hilsen

    svar
  11. Tak for dit input. Nå, det er en ødsel kamel (arbejde). Tak bror.
    Nu er historien at sætte glasset på universitetet, ha ha

    svar
  12. Hej, meget interessant. Jeg har en semi-professionel refleks (en nikon!) Og nu ved jeg hvad jeg skal bruge til den, hehehe
    Men jeg har et forslag. Du siger "brug din hånd til at flade det ark, der ikke skal fotograferes." Og hvorfor ikke bruge en anden plade af noget hårdt materiale? I så fald kan du lave en slags mappe (godt monteret og limet, så den ikke adskilles) i form af en to-siders bog, og du lægger dem oven på bogen for at blive fotograferet. En af siderne eller arkene i mappen vil være noget hårdt materiale; og det andet det glasflade, du bruger til at tage billedet, på den side, der interesserer dig.
    Jeg siger.
    Tak for ideen.

    svar
    • Hej, mange tak for kommentaren

      ja det er en meget god idé, sandheden er, at den metode, jeg efterlod, er meget meget grundlæggende, at digitalisere en bog. Hvis du vil gøre en masse volumen, skal vi foretage et par ændringer for at kunne gå hurtigere :)

      hilsener

      svar
  13. Tak, jeg reserverer! Jeg ville også spørge dig, og hvis der er billeder eller grafik, hvordan gør jeg det? Er billederne integreret som det ses i teksten? Eller hvordan skal jeg gøre, hvis jeg har tekst og billeder på en side?

    svar
  14. Godnat.
    Jeg elskede dit indlæg. Tillykke.
    Jeg siger ikke, at jeg har opnået det, fordi jeg har været i det næstsidste trin: Layoutet.
    Søn, jeg har ønsket at skære mine årer hundrede gange, hvad siger jeg hundreder! TENS !!!
    Ingen sjov, du ville gøre mig en kæmpe tjeneste, hvis du fortalte os om layoutprocessen. Dette ville fuldføre processen fra en enkelt kilde.
    Jeg opfordrer dig til at gøre det.
    Endnu en gang tillykke.

    svar
  15. Sandheden er, at supporten og kameraet er en god idé, men jeg er i tvivl om at scanne de lige først og derefter de ulige og omordne dem, da jeg tror, ​​det ville tage lang tid at gøre det manuelt eller at lære at bruge programmet hehe
    Du siger også, at efter at have taget billedet konverteres det til tekst, som ikke ligner en fotokopi, så for billeder eller tekstfelter, som det ville være, hvis du kunne give det endelige resultat bedre.

    svar
  16. Efter din mening er det bedre med flash eller uden flash i et rum med normalt dagslys med en mobiltelefon (8Mpx)?
    Tak

    svar
    • Hej Eugenia, jeg personligt foretrækker et kamera, der løser lyset, der skal bruges ganske godt. Hvis det er et mobiltelefonkamera, anbefaler jeg normalt dagslys, men ikke direkte. Efter et hvidt gardin, der diffunderer indgangslampen eller med eftermiddagslyset - i et rum på den modsatte side fra hvor solen går ned, da blitzen kan "brænde" billedet (det vil sige, det kan komme meget hvidt ud) .
      Under alle omstændigheder er den bedste mulighed at sende fotografiet - anbefalet JPEG-format - gennem et OCR-scanningsprogram. Normalt løser disse programmer problemerne for dig.

      svar
    • Hvis du bruger glas til at udjævne arkene, tillader flashen ikke, at billedet tages, fordi det reflekteres. I normalt dagslys skal det være mere end nok.

      så længe billederne er skarpe, fungerer OCR meget godt og registrerer alt

      svar
  17. Hej! Jeg vil gerne vide, om du har et fotograferet ark for at se, hvordan det ser ud, da kameraet ikke sætter stor pris på det, ser det ud til, at arket ikke er komplet.

    svar
    • Dette billede er ikke klart, du skal tage al teksten. Det, der ikke ses i billedet, vil ikke blive transformeret af ocr, så ingen ord skal klippes. Jeg tager et billede og uploader det

      svar
  18. Tillykke, jeg kunne virkelig godt lide ideen, jeg læste en kommentar, hvor jeg kunne støtte det ark, der fotograferer os. For eksempel kunne du lægge et skalpapir (tykt pap) fastgjort i bunden af ​​glasset, som ville ligne en mappe, og det ville hjælpe med at gøre det lidt hurtigere, kunne det være?

    svar
  19. Hvis du rammer billedet godt, så det tager al teksten på arket, og du bare ikke har brug for pap, fungerer det lige så hurtigt. Hvis du har svært ved at indramme, kan det være en god idé.

    svar
  20. Tak Nacho for vejledningen.
    Når du scanner en gammel bog, bliver arkene gule, beskidte, er der nogen måde at rense dem på?
    hensyn

    svar
    • Hej Antonio. Hvis du vil sende det gennem OCR, er du ligeglad, fordi det kun holder teksten.

      Hvis du vil generere en pdf fra scannede billeder, kan du redigere dem ved hjælp af Photoshop eller GIMP.

      svar

Efterlad en kommentar