Vediamo come digitalizzare un libro in modo molto veloce e casalingo.
La digitalizzazione di un libro consiste sempre di 2 parti, la prima in cui si ottiene un'immagine del testo e la seconda in cui questa immagine viene trattata con un OCR, un Software di riconoscimento ottico dei caratteri
Tradizionalmente, i libri venivano scansionati pagina per pagina, questo è un processo molto lento che era complesso a causa del dorso dei libri, che curvava le pagine e quindi l'OCR non riconosceva bene le parole. nt che molte persone li sleghino per facilitare il processo di scansione.
Quindi, invece di scansionare le pagine, faremo delle foto. Lavoro con una fotocamera compatta da 10 megapixel, ma potrebbe anche essere fatto con uno smartphone.
Come puoi vedere, è un sistema molto artigianale ed economico, ma anche così, in meno di un'ora ho avuto un libro di 120 pagine in formato digitale (senza impaginazione) e senza fretta.
E non pensare che questo sia usato solo per piratare libri, che puoi usarlo perfettamente per digitalizzare i tuoi appunti di classe ed essere in grado di studiare con un lettore, un ipad o un laptop.
Sistema per digitalizzare un libro
Avremo bisogno
- Una fotocamera di foto
- Un treppiede
- Cartoni e nastro
- Un cristallo
La prima cosa da fare è costruire una piattaforma o leggio per contenere il libro e lo faremo con il cartone. È molto semplice
Nello scatto successivo si apprezzano meglio le parti, unite con nastro adesivo, ad eccezione delle cinghie che creano rigidità nella struttura, quindi togliamo le 2 bacchette e possiamo piegare il leggio e riporlo senza occupare
il dettaglio della colonna vertebrale è importante. A seconda dello spessore del libro dovremmo adattarlo in modo che il libro non sia più grasso e non abbia problemi.
Se vuoi masticare tutto qui ti lascio le misure di quello che ho costruito. Va in cm e x2, x4 è il numero di pezzi di cui hai bisogno per ciascuno
Assemblaggio del digitalizzatore di libri
Useremo il vetro per appiattire la pagina da fotografare, bisogna stare attenti ai riflessi del vetro, quindi è meglio farlo con luce naturale e che cade di lato.
e devi mettere la fotocamera in modo che occupi l'intera pagina, il più vicino possibile (usa lo zoom) e il più centrato possibile.
Come abbiamo detto, il vetro ha il compito di lasciare il foglio da fotografare piatto, sposteremo la pagina opposta in modo che non appaia sullo schermo e lasciamo che fotografi tutto il testo.
Se guardi questa fotografia, sarebbe mal fatta, perché non prende il testo completo
Tutti i margini devono essere visibili, non è possibile tagliare le parole, quindi è molto importante posizionare bene la fotocamera per ottenere le immagini
Come prendo le immagini?
[evidenziato] Sto aggiornando la modifica delle immagini passo dopo passo, che è un punto che non è chiaro e molti di voi me lo chiedono [/ evidenziato]
Esistono diversi metodi e software che ci aiuteranno. Per me la cosa più veloce e comoda è fotografare prima le pagine dispari e poi fare tutte quelle pari.
Li rinominiamo con i numeri di pagina per poterli mescolare, questo può essere fatto con più software gratuiti.
E se vuoi puoi ruotare uno dei 2 batch, quelli dispari o pari, perché saranno allineati in direzioni opposte ea seconda dell'OCR che usi, potresti avere problemi nell'identificazione del testo.
Come ruotare le immagini con GIMP
Useremo GIMP, l'editor di immagini software gratuito e un plug-in chiamato BIMP a cui è abituato modificare in batch le immagini. Ecco un video di come sarebbe stato fatto
Cos'è un OCR?
Siamo all'ultimo passaggio. eseguire le immagini tramite OCR. OCR è un software di riconoscimento ottico dei caratteri, e ciò che fa è riconoscere il testo in un'immagine e convertirlo in testo scritto che puoi salvare come documento di testo, .doc .odt o in altri formati.
Il meglio che conosco è il file Abby brava lettrice una vera meraviglia, ma si paga.
Una volta che tutto è stato digitalizzato, "solo" dobbiamo fare un layout, ma non ne parleremo al momento a meno che non interessi molti di voi.
Infine, poiché sicuramente qualcuno sta cercando di vedere quali libri c'erano nella pila, ecco un dettaglio ;-)
Il digitalizzatore di libri più veloce al mondo
Come so che ti piace la curiosità qui da un video del funzionamento del digitalizzatore di libri più veloce del mondo. È BSF-Auto ed è in grado di acquisire 250 pagine al minuto
Hai maggiori informazioni su http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/
Grazie per aver condiviso questa bella idea, sono uno di quelli che strappa la carta per scannerizzarla, dato che è un motivo di spazio non è stata una grande perdita ma ho anche altre copie che non voglio eliminare di e se li digitalizzo, grazie ancora.
Sono contento che l'idea funzioni per te e che tu possa mantenere intatti i tuoi volumi fisici ;-)
Se riesci a pensare a qualche miglioramento, è sempre il benvenuto.
saluti
Ottima idea.
Credo che il tutorial riesca a comunicare ma mancano ancora molti dati in modo che qualsiasi disgraziato mortale possa fare ciò che intende insegnare qui.
Ciao,
Ho pensato che fosse molto chiaro :-(
Dimmi quali dubbi hai e completa il tutorial.
saluti
Sto cercando un supporto, acquistato o costruito, per il cellulare samsung note II. Ne ho bisogno per scansionare libri e macchina fotografica lucida. Cioè, posizioni verticali, inclinate e orizzontali.
Ciao, ottimo tutorial e molto originale il modo, è semplice per chi non ha uno scanner. Chiedo il permesso di collegarlo dal mio blog.
Saluti.
Ciao Roland.
Nessun problema, anzi i link sono apprezzati :)
saluti
Grazie, ora chiedo il permesso di copiare l'intero testo sul blog, hehehe ... ovviamente rispettando la tua paternità e link.
Saluti.
Saluti. Buona spiegazione e contributo, normalmente lo scannerizzo ma come dici tu a volte le parole non escono completamente ed è più lento. Fortuna
c'è un programma gratuito ocr free ocr. Non è latte ma va abbastanza bene
Grazie mille per la raccomandazione
Lo proverò per vederlo :)
Sembra ottimo, proverò a modificarlo e renderlo più efficiente, ho alcuni libri che vorrei convertire in pdf: D
Secondo Romodolfo manca il nome del programma per integrare le pagine pari e dispari, quindi sarebbe molto completo qualche fattore x tempo che preferiamo masticare sempre grazie Un abbraccio
Per coloro che non sono abituati a gestire serie di immagini, rinominare e mescolare foto pari e dispari crea confusione.
Se potessi dettagliarlo un po 'di più, andrebbe bene.
Se hai bisogno di un programma per rinominare pagine pari e dispari, uno semplice che posso consigliarti è «Lupas Rename 2000», che puoi trovare molto facilmente con google.
Quando ho scansionato i libri, e poiché il mio scanner ha scansionato solo un lato, prima ha scansionato le pagine dispari e poi le pagine pari, e con quel programmino vengono rinominate in un attimo.
Saluti.
Per l'OCR, One Note funziona bene, ci sono "tutorial" su come farlo:
L'ufficiale è qui
Spero che ti aiuti, il tutor mi servirà "un po '" ahahah.
saluti
Ho bisogno di costruire una lucida camera fatta in casa.
grazie
lucida camera
Grazie per il tuo contributo. Bene, è un cammello dispendioso (lavoro). Grazie Fratello.
Adesso la storia è mettere il bicchiere all'università, ah ah
Ciao, molto interessante. Ho una reflex semi professionale (una nikon!) E ora so cosa usare per questo, hehehe
Ma ho un suggerimento. Dici "usa la mano per appiattire il foglio che non verrà fotografato". E perché non utilizzare un'altra lastra di materiale duro? In quel caso, puoi fare una sorta di cartella (ben montata e incollata, in modo che non si sfaldi) a forma di libro di due pagine, e le metti sopra il libro da fotografare. Uno dei lati o dei fogli della cartella sarà del materiale duro; e l'altra, la faccia di vetro che usi per scattare la foto, nella pagina che ti interessa.
Dico.
Grazie per l'idea.
Ciao, grazie mille per il commento
sì, è un'idea molto buona, la verità è che il metodo che ho lasciato è molto molto semplice, digitalizzare un libro. Se hai intenzione di fare molto volume, dovremmo apportare alcune modifiche per poter andare più veloce :)
saluti
Grazie, mi riservo! Inoltre volevo chiederti, e se ci sono immagini o grafica, come faccio? Le immagini sono integrate come si vede nel testo? O come devo fare se ho testo e immagini su una pagina?
Buonanotte.
Ho adorato il tuo post. Congratulazioni.
Non dico di esserci riuscito perché sono rimasto nel penultimo passaggio: il layout.
Figlio, ho voluto tagliarmi le vene centinaia di volte, cosa dico centinaia! DIECI !!!
Non sto scherzando, mi faresti un enorme favore se ci parlassi del processo di layout. Ciò completerebbe il processo da un'unica fonte.
Ti incoraggio a farlo.
Ancora una volta congratulazioni.
La verità è che il supporto e la fotocamera sono una buona idea, ma ho dei dubbi in merito alla scansione prima di quelli pari e poi di quelli dispari e riordinarli poiché penso che ci vorrebbe molto tempo per farlo a mano o per imparare a usare il programma hehe
Dici anche che dopo aver scattato la foto viene convertita in testo, che non è come una fotocopia, quindi per immagini o caselle di testo come sarebbe, se potessi mettere meglio il risultato finale.
Secondo te, con un cellulare (8Mpx), è meglio con flash o senza flash in una stanza con normale luce diurna?
grazie
Ciao Eugenia, personalmente preferisco una fotocamera, che risolve la luce per essere usata abbastanza bene. Se si tratta di una fotocamera del telefono cellulare, consiglio la normale luce diurna, ma non la luce diretta. Dopo una tenda bianca che diffonde la luce d'ingresso o con la luce pomeridiana -in una stanza sul lato opposto da dove sta tramontando il sole-, poiché il flash può "bruciare" l'immagine (cioè può risultare bianchissima) .
In ogni caso, l'opzione migliore è passare la fotografia - consigliato, formato JPEG - attraverso un programma di scansione OCR. Di solito questi programmi risolvono i problemi per te.
Se usi il vetro per levigare le lastre, il flash non permetterà di scattare la foto, perché verrà riflessa. Alla luce del giorno normale deve essere più che sufficiente.
finché le immagini sono nitide, l'OCR funziona molto bene e rileva tutto
Ciao! Vorrei sapere se hai un foglio fotografato per vedere come appare, dato che la fotocamera non lo apprezza molto bene, sembra che il foglio non sia completo.
Quell'immagine non è chiara, devi prendere tutto il testo, ciò che non si vede nell'immagine non verrà trasformato dall'OCR quindi non è necessario tagliare le parole. Scatterò una foto e la caricherò
Complimenti, l'idea mi è piaciuta molto, ho letto un commento in cui mettere un supporto per il foglio che ci fotografa. Ad esempio, potresti mettere un guscio di carta (cartone spesso) attaccato al fondo del vetro, che sembrerebbe una cartella e aiuterebbe a renderlo un po 'più veloce, no?
Se incornici bene la foto in modo che occupi tutto il testo sul foglio e non hai bisogno del cartone, funzionerà altrettanto velocemente. Se trovi difficile inquadrare, potrebbe essere una buona idea.
Grazie Nacho per il tutorial.
Quando si scansiona un vecchio libro, i fogli escono giallastri, sporchi, c'è un modo per pulirli?
saluti
Ciao Antonio. Se hai intenzione di passarlo tramite OCR, non ti interessa perché manterrà solo il testo.
Se hai intenzione di generare un pdf da immagini scansionate, puoi modificarle usando Photoshop o GIMP.
Grazie mille per il tuo aiuto, è stato molto utile.