Ας δούμε πώς να ψηφιοποιήσετε ένα βιβλίο με πολύ γρήγορο και σπιτικό τρόπο.
Η ψηφιοποίηση ενός βιβλίου αποτελείται πάντα από 2 μέρη, το πρώτο όπου λαμβάνετε μια εικόνα του κειμένου και το δεύτερο όπου αυτή η εικόνα αντιμετωπίζεται με OCR, μια Λογισμικό οπτικής αναγνώρισης χαρακτήρων
Παραδοσιακά, τα βιβλία σαρώθηκαν ανά σελίδα, αυτή είναι μια πολύ αργή διαδικασία που ήταν περίπλοκη λόγω των άκρων των βιβλίων, η οποία καμπύλησε τις σελίδες και στη συνέχεια το OCR δεν αναγνώρισε καλά τις λέξεις. Σημειώθηκε ότι πολλοί άνθρωποι τους δεσμεύουν προκειμένου να διευκολύνουν τη διαδικασία σάρωσης.
Έτσι, αντί να σαρώσουμε τις σελίδες, θα τραβήξουμε φωτογραφίες από αυτό. Δουλεύω με μια συμπαγή κάμερα 10 megapixel, αλλά θα μπορούσε ακόμη και να γίνει με ένα smartphone.
Όπως μπορείτε να δείτε, είναι ένα πολύ σπιτικό και φθηνό σύστημα, αλλά παρόλα αυτά, σε λιγότερο από μία ώρα είχα ένα βιβλίο 120 σελίδων σε ψηφιακή μορφή (χωρίς διάταξη) και χωρίς βιασύνη.
Και μην νομίζετε ότι αυτό χρησιμοποιείται μόνο για πειρατικά βιβλία, ότι μπορείτε να το χρησιμοποιήσετε τέλεια για να ψηφιοποιήσετε τις σημειώσεις της τάξης σας και να είστε σε θέση να μελετήσετε με έναν αναγνώστη, iPad ή φορητό υπολογιστή.
Σύστημα για την ψηφιοποίηση ενός βιβλίου
Θα χρειαστούμε
- Μια φωτογραφική μηχανή
- Ένα τρίποδο
- Χαρτόνια και ταινία
- Ένας κρύσταλλος
Το πρώτο πράγμα που πρέπει να κάνετε είναι να φτιάξετε μια πλατφόρμα ή μια ομιλία για να κρατήσετε το βιβλίο και θα το κάνουμε με χαρτόνι. Είναι πολύ απλό
Στην τελευταία λήψη, τα μέρη, ενωμένα με ταινία, εκτιμώνται καλύτερα, εκτός από τους ιμάντες που δημιουργούν ακαμψία στη δομή, οπότε αφαιρούμε τα 2 ραβδιά και μπορούμε να διπλώσουμε τη λεκάνη και να την αποθηκεύσουμε χωρίς να καταλάβουμε
η λεπτομέρεια της σπονδυλικής στήλης είναι σημαντική. Ανάλογα με το πάχος του βιβλίου, θα πρέπει να το προσαρμόσουμε έτσι ώστε το βιβλίο να μην είναι πιο παχύ και να μην έχει προβλήματα.
Αν θέλετε τα πάντα να μασηθούν εδώ, σας αφήνω τις μετρήσεις αυτού που έχω φτιάξει. Πηγαίνει σε cm, και το x2, x4 είναι ο αριθμός των κομματιών που χρειάζεστε κάθε ένα
Συναρμολόγηση ψηφιοποίησης βιβλίων
Θα χρησιμοποιήσουμε το γυαλί για να ισοπεδώσουμε τη σελίδα για φωτογράφηση, πρέπει να είστε προσεκτικοί με τις αντανακλάσεις του γυαλιού, οπότε είναι καλύτερο να το κάνετε με φυσικό φως και αυτό πέφτει από το πλάι.
και πρέπει να τοποθετήσετε την κάμερα έτσι ώστε να διαρκεί ολόκληρη η σελίδα, όσο το δυνατόν πιο κοντά (χρησιμοποιήστε το ζουμ) και όσο πιο κεντρικά μπορείτε.
Όπως είπαμε, το γυαλί είναι υπεύθυνο να αφήσει το φύλλο να φωτογραφηθεί επίπεδο, θα μετακινήσουμε την αντίθετη σελίδα μακριά, ώστε να μην εμφανίζεται στην οθόνη και να την αφήσουμε να φωτογραφίσει όλο το κείμενο.
Αν κοιτάξετε αυτή τη φωτογραφία, θα ήταν κακή, γιατί δεν παίρνει το πλήρες κείμενο
Όλα τα περιθώρια πρέπει να είναι ορατά, δεν μπορείτε να κόψετε τις λέξεις, οπότε είναι πολύ σημαντικό να τοποθετήσετε την κάμερα καλά για να λάβετε τις εικόνες
Πώς μπορώ να τραβήξω τις εικόνες;
[επισημαίνεται] Ενημερώνω την επεξεργασία των εικόνων βήμα προς βήμα, κάτι που δεν είναι σαφές και πολλοί από εσάς με ρωτάτε [/ επισημαίνεται]
Υπάρχουν αρκετές μέθοδοι και λογισμικό που θα μας βοηθήσουν. Για μένα, το γρηγορότερο και πιο άνετο πράγμα είναι να φωτογραφίζω πρώτα τις περίεργες σελίδες και μετά να κάνω όλες τις ομοιόμορφες.
Μετονομάζουμε με τους αριθμούς σελίδων για να μπορούμε να τα συνδυάσουμε, αυτό μπορεί να γίνει με πολλαπλά δωρεάν λογισμικά.
Και αν θέλετε μπορείτε να περιστρέψετε μία από τις 2 παρτίδες, είτε τις περίεργες είτε τις ζυγές, επειδή θα ευθυγραμμιστούν σε αντίθετες κατευθύνσεις και ανάλογα με το OCR που χρησιμοποιείτε, ενδέχεται να έχετε προβλήματα με τον προσδιορισμό του κειμένου.
Πώς να περιστρέψετε εικόνες με το GIMP
Θα χρησιμοποιήσουμε το GIMP, το πρόγραμμα επεξεργασίας εικόνων δωρεάν λογισμικού και ένα πρόσθετο που ονομάζεται BIMP μαζική επεξεργασία εικόνων. Εδώ είναι ένα βίντεο για το πώς θα γίνει
Τι είναι το OCR;
Βρισκόμαστε στο τελευταίο βήμα. εκτελέστε τις εικόνες μέσω OCR. Το OCR είναι λογισμικό αναγνώρισης οπτικών χαρακτήρων, το οποίο κάνει αναγνωρίστε κείμενο σε μια εικόνα και μετατρέψτε το σε γραπτό κείμενο που μπορείτε να αποθηκεύσετε ως έγγραφο κειμένου, είτε .doc .odt είτε σε άλλες μορφές.
Το καλύτερο που ξέρω, είναι το Abby ωραία αναγνώστη ένα πραγματικό θαύμα, αλλά πληρώνεται.
Μόλις όλα έχουν ψηφιοποιηθεί, "μόνο" πρέπει να κάνουμε μια διάταξη, αλλά δεν πρόκειται να το συζητήσουμε αυτήν τη στιγμή, εκτός εάν ενδιαφέρει πολλούς από εσάς.
Τέλος, καθώς σίγουρα κάποιος προσπαθεί να δει ποια βιβλία ήταν στη στοίβα, ακολουθεί μια λεπτομέρεια ;-)
Ταχύτερος ψηφιοποιητής βιβλίων στον κόσμο
Πώς ξέρω ότι σας αρέσει τα ασήμαντα εδώ από ένα βίντεο της λειτουργίας του ταχύτερου ψηφιοποιητή βιβλίων στον κόσμο. Είναι το BSF-Auto και έχει τη δυνατότητα σάρωσης 250 σελίδων ανά λεπτό
Έχετε περισσότερες πληροφορίες στο http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/
Σας ευχαριστώ που μοιραστήκατε αυτήν την καλή ιδέα, είμαι ένας από αυτούς που διαλύουν το χαρτί για να το σαρώσει, καθώς είναι λόγος για το διάστημα που δεν είχε μεγάλη απώλεια, αλλά έχω και άλλα αντίγραφα που δεν θέλω να χωρίσω με και αν τα ψηφιοποιήσω, σας ευχαριστώ ξανά.
Χαίρομαι που η ιδέα λειτουργεί για εσάς και μπορείτε να διατηρήσετε ανέπαφους τους φυσικούς όγκους ;-)
Εάν μπορείτε να σκεφτείτε οποιαδήποτε βελτίωση, είναι πάντα ευπρόσδεκτο.
χαιρετίσματα
Εξαιρετική ιδέα.
Πιστεύω ότι το σεμινάριο καταφέρνει να επικοινωνήσει, αλλά εξακολουθεί να στερείται πολλών δεδομένων, έτσι ώστε κάθε θνητός δυσάρεστος να κάνει ό, τι σκοπεύει να διδάξει εδώ.
Γεια σας,
Νόμιζα ότι ήταν πολύ σαφές :-(
Πείτε μου τι αμφιβολίες έχετε και ολοκληρώστε το σεμινάριο.
χαιρετίσματα
Ψάχνω για υποστήριξη, αγόρασε ή κατασκευάστηκε, για φορητές συσκευές Samsung note II. Το χρειάζομαι για σάρωση βιβλίων και φωτογραφικών μηχανών. Δηλαδή, κάθετες, κεκλιμένες και οριζόντιες θέσεις.
Γεια σας, πολύ καλό σεμινάριο και πολύ πρωτότυπο τρόπο, είναι απλό για όσους δεν διαθέτουν σαρωτή. Ζητώ άδεια να το συνδέσω από το ιστολόγιό μου.
Χαιρετισμούς.
Γεια Roland.
Κανένα πρόβλημα, αντίθετα, οι σύνδεσμοι εκτιμώνται :)
χαιρετίσματα
Ευχαριστώ, τώρα ζητώ άδεια να αντιγράψω ολόκληρο το κείμενο στο blog, hehehe ... σεβαστά προφανώς το συντάκτη και τους συνδέσμους.
Χαιρετισμούς.
Χαιρετίσματα. Καλή εξήγηση και συνεισφορά, συνήθως το σαρώνω, αλλά όπως λέτε μερικές φορές οι λέξεις δεν βγαίνουν εντελώς και είναι πιο αργή. Τυχη
υπάρχει ένα δωρεάν πρόγραμμα δωρεάν ocr. Δεν είναι γάλα, αλλά κάνει αρκετά καλά
Ευχαριστώ πολύ για τη σύσταση
Θα το αποδείξω αυτό :)
Φαίνεται εξαιρετικό, θα προσπαθήσω να το τροποποιήσω και να το κάνω πιο αποτελεσματικό, έχω κάποια βιβλία που θα ήθελα να μετατρέψω σε pdf: D
Σύμφωνα με τον Romodolfo, το όνομα του προγράμματος λείπει για την ενσωμάτωση των ομοιόμορφων και περίεργων σελίδων, οπότε θα ήταν πολύ πλήρης κάποιος παράγοντας x χρόνος που προτιμούμε να μασάμε πάντα ευχαριστώ
Για εκείνους που δεν είναι συνηθισμένοι στη διαχείριση σειράς εικόνων, η μετονομασία και η ανάμειξη ομοιόμορφων και περίεργων φωτογραφιών είναι σύγχυση.
Αν μπορούσατε να το αναλύσετε λίγο περισσότερο, θα ήταν εντάξει.
Εάν χρειάζεστε ένα πρόγραμμα για να μετονομάσετε ομοιόμορφες και μονές σελίδες, ένα απλό που μπορώ να προτείνω είναι το «Lupas Rename 2000», το οποίο μπορείτε να βρείτε πολύ εύκολα με το google.
Όταν έχω σαρώσει βιβλία και αφού ο σαρωτής μου σάρωσε μόνο τη μία πλευρά, πρώτα σάρωσε τις περίεργες σελίδες και μετά τις ζυγές σελίδες και με αυτό το μικρό πρόγραμμα μετονομάστηκαν σε μια στιγμή.
Ένα χαιρετισμό.
Για το OCR, το One Note λειτουργεί καλά, υπάρχουν "tutorials" για το πώς να το κάνετε:
Ο αξιωματικός είναι Aquí
Ελπίζω να σε βοηθήσει, ο δάσκαλος θα με εξυπηρετήσει "λίγο" χαχαχα.
αφορά
Πρέπει να φτιάξω μια σπιτική κάμερα lucida.
gracias
κάμερα Lucida
Σας ευχαριστούμε για τη συμβολή σας. Λοιπόν, είναι μια σπατάλη καμήλα (δουλειά). Ευχαριστώ αδερφέ.
Τώρα η ιστορία είναι να βάλεις το ποτήρι στο πανεπιστήμιο, χα χα
Γεια σας, πολύ ενδιαφέρον. Έχω ένα ημι-επαγγελματικό αντανακλαστικό (ένα nikon!) Και τώρα ξέρω τι να το χρησιμοποιήσω, hehehe
Αλλά έχω μια πρόταση. Λέτε "χρησιμοποιήστε το χέρι σας για να ισιώσετε το φύλλο που δεν πρόκειται να φωτογραφηθεί." Και γιατί να μην χρησιμοποιήσετε άλλη πλάκα από σκληρό υλικό; Σε αυτήν την περίπτωση, μπορείτε να δημιουργήσετε ένα είδος φακέλου (καλά συναρμολογημένο και κολλημένο, έτσι ώστε να μην ξεχωρίζει) σε σχήμα βιβλίου δύο σελίδων και τα τοποθετείτε στην κορυφή του βιβλίου για φωτογράφηση. Μία από τις πλευρές ή τα φύλλα του φακέλου θα είναι σκληρό υλικό. και το άλλο, το γυάλινο πρόσωπο που χρησιμοποιείτε για να τραβήξετε τη φωτογραφία, στη σελίδα που σας ενδιαφέρει.
Λέω.
Ευχαριστώ για την ιδέα.
Γεια σας, σας ευχαριστώ πολύ για το σχόλιο
Ναι είναι μια πολύ καλή ιδέα, η αλήθεια είναι ότι η μέθοδος που άφησα είναι πολύ βασική, για την ψηφιοποίηση ενός βιβλίου. Εάν πρόκειται να κάνετε πολύ όγκο, θα πρέπει να κάνουμε μερικές αλλαγές για να μπορέσουμε να προχωρήσουμε πιο γρήγορα :)
χαιρετίσματα
Ευχαριστώ, κάνω κράτηση! Επίσης, ήθελα να σας ρωτήσω και αν υπάρχουν εικόνες ή γραφικά, πώς μπορώ να κάνω; Είναι οι εικόνες ενσωματωμένες όπως φαίνεται στο κείμενο; Ή πώς πρέπει να κάνω εάν έχω κείμενο και εικόνες σε μια σελίδα;
Καληνύχτα.
Μου άρεσε πολύ η ανάρτησή σας. Συγχαρητήρια.
Δεν λέω ότι το κατάφερα επειδή έχω μείνει στο προτελευταίο βήμα: Η διάταξη.
Γιέ μου, ήθελα να κόψω τις φλέβες μου εκατοντάδες φορές, τι λέω εκατοντάδες! ΤΕΝΕΣ !!!
Χωρίς αστεία, θα μου έκανα τεράστια χάρη αν μας είπατε για τη διαδικασία διάταξης. Έτσι, η διαδικασία θα τελείωνε από μία μόνο πηγή.
Σας ενθαρρύνω να το κάνετε.
Για άλλη μια φορά, συγχαρητήρια.
Η αλήθεια είναι ότι η υποστήριξη και η κάμερα είναι μια καλή ιδέα, αλλά έχω αμφιβολίες σχετικά με τη σάρωση των ζυγών πρώτα και μετά των περίεργων και την αναδιάταξή τους, καθώς νομίζω ότι θα χρειαζόταν πολύς χρόνος για να το κάνουμε με το χέρι ή να μάθω να χρησιμοποιήστε το πρόγραμμα hehe
Λέτε επίσης ότι μετά τη λήψη της φωτογραφίας μετατρέπεται σε κείμενο, το οποίο δεν μοιάζει με φωτοαντίγραφο, έτσι για εικόνες ή πλαίσια κειμένου όπως θα ήταν, αν μπορούσατε να βάλετε το τελικό αποτέλεσμα καλύτερα.
Κατά τη γνώμη σας, με κινητό τηλέφωνο (8Mpx), είναι καλύτερο με φλας ή χωρίς φλας σε δωμάτιο με κανονικό φως της ημέρας;
Ευχαριστίες
Γεια σας Ευγενία, προσωπικά προτιμώ μια κάμερα, η οποία λύνει το φως για να χρησιμοποιηθεί αρκετά καλά. Εάν πρόκειται για κάμερα κινητού τηλεφώνου, προτείνω κανονικό φως της ημέρας, αλλά όχι άμεσο. Μετά από μια λευκή κουρτίνα που διαχέει το φως εισόδου ή με το απογευματινό φως - σε ένα δωμάτιο στην αντίθετη πλευρά από όπου ο ήλιος δύει-, καθώς το φλας μπορεί να "κάψει" την εικόνα (δηλαδή, μπορεί να βγει πολύ λευκό) .
Σε κάθε περίπτωση, η καλύτερη επιλογή είναι να περάσετε τη φωτογραφία - προτεινόμενη μορφή JPEG - μέσω ενός προγράμματος σάρωσης OCR. Συνήθως αυτά τα προγράμματα επιλύουν τα προβλήματα για εσάς.
Εάν χρησιμοποιείτε γυαλί για να εξομαλύνετε τα φύλλα, το φλας δεν θα επιτρέψει τη λήψη της φωτογραφίας, επειδή θα αντικατοπτρίζεται. Στο κανονικό φως της ημέρας πρέπει να είναι περισσότερο από αρκετό.
εφ 'όσον οι εικόνες είναι ευκρινείς, το OCR λειτουργεί πολύ καλά και ανιχνεύει τα πάντα
Γειά σου! Θα ήθελα να μάθω αν έχετε ένα φωτογραφικό φύλλο για να δείτε πώς φαίνεται, καθώς η κάμερα δεν το εκτιμά πολύ καλά, φαίνεται ότι το φύλλο δεν είναι πλήρες.
Αυτή η εικόνα δεν είναι ξεκάθαρη, πρέπει να πάρετε όλο το κείμενο, αυτό που δεν φαίνεται στην εικόνα δεν θα μεταμορφωθεί από το ocr, έτσι δεν πρέπει να κοπούν λέξεις. Θα τραβήξω μια φωτογραφία και θα την ανεβάσω
Συγχαρητήρια, μου άρεσε πολύ η ιδέα, διάβασα ένα σχόλιο στο οποίο έπρεπε να υποστηρίξω το φύλλο που μας φωτογραφίζει. Για παράδειγμα, θα μπορούσατε να βάλετε ένα κέλυφος χαρτί (χοντρό χαρτόνι) που είναι τοποθετημένο στο κάτω μέρος του γυαλιού, το οποίο θα μοιάζει με ένα φάκελο και θα σας βοηθήσει να το κάνετε λίγο πιο γρήγορο, θα μπορούσε να είναι;
Αν πλαισιώσετε καλά τη φωτογραφία έτσι ώστε να παίρνει όλο το κείμενο στο φύλλο και απλά δεν χρειάζεστε το χαρτόνι, θα λειτουργεί εξίσου γρήγορα. Εάν δυσκολεύεστε να καρέ, μπορεί να είναι καλή ιδέα.
Ευχαριστώ Nacho για το σεμινάριο.
Όταν σαρώσετε ένα παλιό βιβλίο, τα φύλλα βγάζουν κιτρινωπά, βρώμικα, υπάρχει τρόπος να τα καθαρίσετε;
αφορά
Γεια σας Αντόνιο. Εάν πρόκειται να το περάσετε μέσω του OCR, δεν σας ενδιαφέρει γιατί θα κρατήσει μόνο το κείμενο.
Εάν πρόκειται να δημιουργήσετε ένα pdf από σαρωμένες εικόνες, μπορείτε να τα επεξεργαστείτε χρησιμοποιώντας το Photoshop ή το GIMP.
Σας ευχαριστώ πολύ για τη βοήθειά σας, ήταν πολύ χρήσιμη.