Come digitalizzare un libro

Vediamo come digitalizzare un libro in modo molto veloce e casalingo.

La digitalizzazione di un libro consiste sempre di 2 parti, la prima in cui si ottiene un'immagine del testo e la seconda in cui questa immagine viene trattata con un OCR, un Software di riconoscimento ottico dei caratteri

Digitalizza i libri in ebook

Tradizionalmente, i libri venivano scansionati pagina per pagina, questo è un processo molto lento che era complesso a causa del dorso dei libri, che curvava le pagine e quindi l'OCR non riconosceva bene le parole. nt che molte persone li sleghino per facilitare il processo di scansione.

Quindi, invece di scansionare le pagine, faremo delle foto. Lavoro con una fotocamera compatta da 10 megapixel, ma potrebbe anche essere fatto con uno smartphone.

Come digitalizzare un libro a casa

Come puoi vedere, è un sistema molto artigianale ed economico, ma anche così, in meno di un'ora ho avuto un libro di 120 pagine in formato digitale (senza impaginazione) e senza fretta.

E non pensare che questo sia usato solo per piratare libri, che puoi usarlo perfettamente per digitalizzare i tuoi appunti di classe ed essere in grado di studiare con un lettore, un ipad o un laptop.

Sistema per digitalizzare un libro

Avremo bisogno

  • Una fotocamera di foto
  • Un treppiede
  • Cartoni e nastro
  • Un cristallo

La prima cosa da fare è costruire una piattaforma o leggio per contenere il libro e lo faremo con il cartone. È molto semplice

leggio per digitalizzare libri

Nello scatto successivo si apprezzano meglio le parti, unite con nastro adesivo, ad eccezione delle cinghie che creano rigidità nella struttura, quindi togliamo le 2 bacchette e possiamo piegare il leggio e riporlo senza occupare

come fare un leggio di cartone

resto della musica e pezzi di supporto

il dettaglio della colonna vertebrale è importante. A seconda dello spessore del libro dovremmo adattarlo in modo che il libro non sia più grasso e non abbia problemi.

leggio digitalizza il libro con la fotocamera

dettaglio dorso leggio

Se vuoi masticare tutto qui ti lascio le misure di quello che ho costruito. Va in cm e x2, x4 è il numero di pezzi di cui hai bisogno per ciascuno

Pianifica la costruzione del leggio e digitalizza i libri

Assemblaggio del digitalizzatore di libri

Assemblea per digitalizzare libri

Useremo il vetro per appiattire la pagina da fotografare, bisogna stare attenti ai riflessi del vetro, quindi è meglio farlo con luce naturale e che cade di lato.

e devi mettere la fotocamera in modo che occupi l'intera pagina, il più vicino possibile (usa lo zoom) e il più centrato possibile.

creazione di ebook con una fotocamera

Come abbiamo detto, il vetro ha il compito di lasciare il foglio da fotografare piatto, sposteremo la pagina opposta in modo che non appaia sullo schermo e lasciamo che fotografi tutto il testo.

Se guardi questa fotografia, sarebbe mal fatta, perché non prende il testo completo

immagini per l'OCR

pagina difettosa per ocr

Tutti i margini devono essere visibili, non è possibile tagliare le parole, quindi è molto importante posizionare bene la fotocamera per ottenere le immagini

Come prendo le immagini?

[evidenziato] Sto aggiornando la modifica delle immagini passo dopo passo, che è un punto che non è chiaro e molti di voi me lo chiedono [/ evidenziato]

Esistono diversi metodi e software che ci aiuteranno. Per me la cosa più veloce e comoda è fotografare prima le pagine dispari e poi fare tutte quelle pari.

Li rinominiamo con i numeri di pagina per poterli mescolare, questo può essere fatto con più software gratuiti.

E se vuoi puoi ruotare uno dei 2 batch, quelli dispari o pari, perché saranno allineati in direzioni opposte ea seconda dell'OCR che usi, potresti avere problemi nell'identificazione del testo.

Come ruotare le immagini con GIMP

Useremo GIMP, l'editor di immagini software gratuito e un plug-in chiamato BIMP a cui è abituato modificare in batch le immagini. Ecco un video di come sarebbe stato fatto

Cos'è un OCR?

Siamo all'ultimo passaggio. eseguire le immagini tramite OCR. OCR è un software di riconoscimento ottico dei caratteri, e ciò che fa è riconoscere il testo in un'immagine e convertirlo in testo scritto che puoi salvare come documento di testo, .doc .odt o in altri formati.

Il meglio che conosco è il file Abby brava lettrice una vera meraviglia, ma si paga.

Una volta che tutto è stato digitalizzato, "solo" dobbiamo fare un layout, ma non ne parleremo al momento a meno che non interessi molti di voi.

Infine, poiché sicuramente qualcuno sta cercando di vedere quali libri c'erano nella pila, ecco un dettaglio ;-)

sperimentare libri e fai da te

Il digitalizzatore di libri più veloce al mondo

Come so che ti piace la curiosità qui da un video del funzionamento del digitalizzatore di libri più veloce del mondo. È BSF-Auto ed è in grado di acquisire 250 pagine al minuto

Hai maggiori informazioni su http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/

35 commenti su "Come digitalizzare un libro"

  1. Grazie per aver condiviso questa bella idea, sono uno di quelli che strappa la carta per scannerizzarla, dato che è un motivo di spazio non è stata una grande perdita ma ho anche altre copie che non voglio eliminare di e se li digitalizzo, grazie ancora.

    risposta
  2. Sono contento che l'idea funzioni per te e che tu possa mantenere intatti i tuoi volumi fisici ;-)

    Se riesci a pensare a qualche miglioramento, è sempre il benvenuto.

    saluti

    risposta
  3. Credo che il tutorial riesca a comunicare ma mancano ancora molti dati in modo che qualsiasi disgraziato mortale possa fare ciò che intende insegnare qui.

    risposta
  4. Sto cercando un supporto, acquistato o costruito, per il cellulare samsung note II. Ne ho bisogno per scansionare libri e macchina fotografica lucida. Cioè, posizioni verticali, inclinate e orizzontali.

    risposta
  5. Saluti. Buona spiegazione e contributo, normalmente lo scannerizzo ma come dici tu a volte le parole non escono completamente ed è più lento. Fortuna

    risposta
  6. Secondo Romodolfo manca il nome del programma per integrare le pagine pari e dispari, quindi sarebbe molto completo qualche fattore x tempo che preferiamo masticare sempre grazie Un abbraccio

    risposta
  7. Per coloro che non sono abituati a gestire serie di immagini, rinominare e mescolare foto pari e dispari crea confusione.

    Se potessi dettagliarlo un po 'di più, andrebbe bene.

    risposta
  8. Se hai bisogno di un programma per rinominare pagine pari e dispari, uno semplice che posso consigliarti è «Lupas Rename 2000», che puoi trovare molto facilmente con google.

    Quando ho scansionato i libri, e poiché il mio scanner ha scansionato solo un lato, prima ha scansionato le pagine dispari e poi le pagine pari, e con quel programmino vengono rinominate in un attimo.

    Saluti.

    risposta
  9. Grazie per il tuo contributo. Bene, è un cammello dispendioso (lavoro). Grazie Fratello.
    Adesso la storia è mettere il bicchiere all'università, ah ah

    risposta
  10. Ciao, molto interessante. Ho una reflex semi professionale (una nikon!) E ora so cosa usare per questo, hehehe
    Ma ho un suggerimento. Dici "usa la mano per appiattire il foglio che non verrà fotografato". E perché non utilizzare un'altra lastra di materiale duro? In quel caso, puoi fare una sorta di cartella (ben montata e incollata, in modo che non si sfaldi) a forma di libro di due pagine, e le metti sopra il libro da fotografare. Uno dei lati o dei fogli della cartella sarà del materiale duro; e l'altra, la faccia di vetro che usi per scattare la foto, nella pagina che ti interessa.
    Dico.
    Grazie per l'idea.

    risposta
    • Ciao, grazie mille per il commento

      sì, è un'idea molto buona, la verità è che il metodo che ho lasciato è molto molto semplice, digitalizzare un libro. Se hai intenzione di fare molto volume, dovremmo apportare alcune modifiche per poter andare più veloce :)

      saluti

      risposta
  11. Grazie, mi riservo! Inoltre volevo chiederti, e se ci sono immagini o grafica, come faccio? Le immagini sono integrate come si vede nel testo? O come devo fare se ho testo e immagini su una pagina?

    risposta
  12. Buonanotte.
    Ho adorato il tuo post. Congratulazioni.
    Non dico di esserci riuscito perché sono rimasto nel penultimo passaggio: il layout.
    Figlio, ho voluto tagliarmi le vene centinaia di volte, cosa dico centinaia! DIECI !!!
    Non sto scherzando, mi faresti un enorme favore se ci parlassi del processo di layout. Ciò completerebbe il processo da un'unica fonte.
    Ti incoraggio a farlo.
    Ancora una volta congratulazioni.

    risposta
  13. La verità è che il supporto e la fotocamera sono una buona idea, ma ho dei dubbi in merito alla scansione prima di quelli pari e poi di quelli dispari e riordinarli poiché penso che ci vorrebbe molto tempo per farlo a mano o per imparare a usare il programma hehe
    Dici anche che dopo aver scattato la foto viene convertita in testo, che non è come una fotocopia, quindi per immagini o caselle di testo come sarebbe, se potessi mettere meglio il risultato finale.

    risposta
    • Ciao Eugenia, personalmente preferisco una fotocamera, che risolve la luce per essere usata abbastanza bene. Se si tratta di una fotocamera del telefono cellulare, consiglio la normale luce diurna, ma non la luce diretta. Dopo una tenda bianca che diffonde la luce d'ingresso o con la luce pomeridiana -in una stanza sul lato opposto da dove sta tramontando il sole-, poiché il flash può "bruciare" l'immagine (cioè può risultare bianchissima) .
      In ogni caso, l'opzione migliore è passare la fotografia - consigliato, formato JPEG - attraverso un programma di scansione OCR. Di solito questi programmi risolvono i problemi per te.

      risposta
    • Se usi il vetro per levigare le lastre, il flash non permetterà di scattare la foto, perché verrà riflessa. Alla luce del giorno normale deve essere più che sufficiente.

      finché le immagini sono nitide, l'OCR funziona molto bene e rileva tutto

      risposta
  14. Ciao! Vorrei sapere se hai un foglio fotografato per vedere come appare, dato che la fotocamera non lo apprezza molto bene, sembra che il foglio non sia completo.

    risposta
    • Quell'immagine non è chiara, devi prendere tutto il testo, ciò che non si vede nell'immagine non verrà trasformato dall'OCR quindi non è necessario tagliare le parole. Scatterò una foto e la caricherò

      risposta
  15. Complimenti, l'idea mi è piaciuta molto, ho letto un commento in cui mettere un supporto per il foglio che ci fotografa. Ad esempio, potresti mettere un guscio di carta (cartone spesso) attaccato al fondo del vetro, che sembrerebbe una cartella e aiuterebbe a renderlo un po 'più veloce, no?

    risposta
  16. Se incornici bene la foto in modo che occupi tutto il testo sul foglio e non hai bisogno del cartone, funzionerà altrettanto velocemente. Se trovi difficile inquadrare, potrebbe essere una buona idea.

    risposta
  17. Grazie Nacho per il tutorial.
    Quando si scansiona un vecchio libro, i fogli escono giallastri, sporchi, c'è un modo per pulirli?
    saluti

    risposta
    • Ciao Antonio. Se hai intenzione di passarlo tramite OCR, non ti interessa perché manterrà solo il testo.

      Se hai intenzione di generare un pdf da immagini scansionate, puoi modificarle usando Photoshop o GIMP.

      risposta

Lascia un commento