Cum se digitalizează o carte

Să vedem cum se digitalizează o carte într-un mod foarte rapid și de casă.

Digitalizarea unei cărți constă întotdeauna din 2 părți, prima în care obțineți o imagine a textului și a doua în care această imagine este tratată cu un OCR, A Software de recunoaștere optică a caracterelor

Digitizați cărțile în cărți electronice

În mod tradițional, cărțile erau scanate pagină cu pagină, acesta este un proces foarte lent, care a fost complex datorită coloanelor vertebrale ale cărților, care au curbat paginile și apoi OCR nu a recunoscut bine cuvintele. S-a observat că mulți oameni nu le leagă pentru a facilita procesul de scanare.

Deci, în loc să scanăm paginile, vom face fotografii. Lucrez cu o cameră compactă de 10 megapixeli, dar s-ar putea realiza chiar și cu un smartphone.

Cum să digitalizați o carte acasă

După cum puteți vedea, este un sistem foarte de casă și ieftin, dar chiar și așa, în mai puțin de o oră am avut o carte de 120 de pagini în format digital (fără aspect) și fără grabă.

Și nu credeți că acest lucru este folosit doar pentru a pirata cărți, că îl puteți folosi perfect pentru a digitaliza notele de curs și pentru a putea studia cu un cititor, iPad sau laptop.

Sistem de digitalizare a unei cărți

Noi vom avea nevoie

  • Un singur aparat de fotografiat
  • Un trepied
  • Cartoane și bandă
  • Un cristal

Primul lucru de făcut este să construim o platformă sau un lutru pentru a ține cartea și o vom face cu carton. Este foarte simplu

lutru pentru digitalizarea cărților

În imaginea de mai târziu, piesele, îmbinate cu bandă, sunt mai bine apreciate, cu excepția curelelor care creează rigiditate în structură, astfel încât să scoatem cele 2 bețe și să putem îndoi lutrul și să-l depozităm fără să-l ocupăm.

cum se face un pupitru din carton

odihnă muzicală și piese de sprijin

detaliul coloanei vertebrale este important. În funcție de grosimea cărții, ar trebui să o adaptăm astfel încât cartea să nu fie mai grasă și să nu aibă probleme.

lutru digitalizează carte cu cameră

detaliu coloanei lutru

Dacă vreți totul mestecat aici vă las măsurătorile celui pe care l-am construit. Merge în cm, iar x2, x4 este numărul de piese de care aveți nevoie pentru fiecare

Planificați construirea lutrului și digitalizarea cărților

Asamblarea digitalizatorului de carte

Asamblare pentru digitalizarea cărților

Vom folosi paharul pentru a ne aplatiza pagina de fotografiat, trebuie să aveți grijă la reflexiile sticlei, așa că cel mai bine este să o faceți cu lumină naturală și care cade din lateral.

și trebuie să puneți camera astfel încât să ia întreaga pagină, cât mai aproape posibil (utilizați zoom) și cât mai centrat.

crearea de cărți electronice cu o cameră

După cum am spus, sticla este însărcinată cu lăsarea foii pentru a fi fotografiată plat, vom îndepărta pagina opusă, astfel încât să nu apară pe ecran și să-l lăsăm să fotografieze tot textul.

Dacă te uiți la această fotografie, ar fi prost realizată, deoarece nu ia textul integral

imagini pentru ocr

pagină defectă pentru ocr

Toate marginile trebuie să fie vizibile, nu puteți tăia cuvintele, deci este foarte important să plasați bine camera pentru a obține imaginile

Cum pot face imaginile?

[evidențiat] Actualizez editarea imaginilor pas cu pas, care este un punct care nu este clar și mulți dintre voi mă întrebați [/ evidențiat]

Există mai multe metode și software care ne vor ajuta. Pentru mine, cel mai rapid și mai confortabil lucru este să fotografiez mai întâi paginile ciudate și apoi să le fac pe toate.

Le redenumim cu numerele de pagină pentru a le putea amesteca, acest lucru se poate face cu mai multe software-uri gratuite.

Și dacă doriți, puteți roti unul dintre cele 2 loturi, fie cele impare, fie cele pare, deoarece acestea vor fi aliniate în direcții opuse și în funcție de OCR pe care îl utilizați, este posibil să aveți probleme la identificarea textului.

Cum se rotește imaginile cu GIMP

Vom folosi GIMP, editorul de imagini software gratuit și un plugin numit BIMP cu care este obișnuit editați imagini în serie. Iată un videoclip despre cum s-ar face

Ce este un OCR?

Suntem în ultimul pas. rulați imagini prin OCR. OCR este un software de recunoaștere optică a caracterelor, ceea ce face este recunoașteți textul dintr-o imagine și convertiți-l în text scris pe care îl puteți salva ca document text, fie .doc .odt, fie în alte formate.

Cel mai bun pe care îl știu este Cititor bun Abby o adevărată minune, dar este plătită.

Odată ce totul a fost digitalizat, „numai” trebuie să facem un aspect, dar nu vom vorbi despre acest lucru în acest moment decât dacă ne interesează pe mulți dintre voi.

În cele din urmă, așa cum sigur cineva încearcă să vadă ce cărți erau în stivă, iată un detaliu ;-)

cărți de experiment și DIY

Cel mai rapid digitalizator de carte din lume

De unde știu că vă plac trivia aici dintr-un videoclip cu funcționarea celui mai rapid digitalizator de cărți din lume. Este BSF-Auto și este capabil să scaneze 250 de pagini pe minut

Aveți mai multe informații la http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/

Dacă sunteți o persoană neliniștită ca noi și doriți să colaborați la întreținerea și îmbunătățirea proiectului, puteți face o donație. Toți banii vor merge pentru a cumpăra cărți și materiale pentru a experimenta și a face tutoriale

35 de comentarii la „Cum se digitalizează o carte”

  1. Vă mulțumesc că ne-ați împărtășit această idee bună, eu sunt unul dintre cei care sfâșie hârtia pentru a o scana, deoarece este un motiv pentru spațiu, nu a fost o pierdere mare, dar am și alte copii pe care nu vreau să le scap. de și dacă le digitizez, vă mulțumesc din nou.

    răspuns
  2. Mă bucur că ideea funcționează pentru dvs. și vă puteți păstra intacte volumele fizice ;-)

    Dacă vă puteți gândi la o îmbunătățire, este întotdeauna binevenită.

    Un saludo

    răspuns
  3. Cred că tutorialul reușește să comunice, dar îi lipsesc încă multe date, astfel încât orice nenorocit muritor să poată face ceea ce intenționează să predea aici.

    răspuns
  4. Caut un suport, cumpărat sau construit, pentru mobil Samsung Note II. Am nevoie de el pentru a scana cărți și aparate foto lucide. Adică poziții verticale, înclinate și orizontale.

    răspuns
  5. Salutari. Bună explicație și contribuție, în mod normal, o scanez, dar, cum spui, uneori cuvintele nu ies complet și este mai lent. Noroc

    răspuns
  6. Potrivit lui Romodolfo, numele programului lipsește pentru a integra paginile pare și impare, deci ar fi foarte complet un factor de timp x preferăm să mestecăm întotdeauna mulțumim O îmbrățișare

    răspuns
  7. Pentru cei care nu sunt obișnuiți să gestioneze serii de imagini, redenumirea și amestecarea fotografiilor pare și ciudate este confuză.

    Dacă ați putea să-l detaliați puțin mai mult, ar fi bine.

    răspuns
  8. Dacă aveți nevoie de un program pentru a redenumi paginile pare și impare, unul simplu pe care îl pot recomanda este «Lupas Rename 2000», pe care îl puteți găsi foarte ușor cu google.

    Când am scanat cărți și, din moment ce scanerul meu a scanat doar o parte, mai întâi a scanat paginile impare și apoi paginile pare și, cu acel mic program, acestea sunt redenumite într-o clipă.

    Un salut.

    răspuns
  9. Pentru OCR, One Note funcționează bine, există „tutoriale” despre cum să o faceți:

    Ofițerul este aici

    Sper să te ajute, tutorele mă va servi „puțin” hahaha.

    În ceea ce priveşte

    răspuns
  10. Vă mulțumim pentru contribuție. Ei bine, este o cămilă risipitoare (lucru). Frate mulțumesc.
    Acum povestea este să punem paharul la universitate, ha ha

    răspuns
  11. Salut, foarte interesant. Am un reflex semi-profesional (un nikon!) Și acum știu ce să folosesc pentru asta, hehehe
    Dar am o sugestie. Spui „folosește-ți mâna pentru a aplatiza foaia care nu va fi fotografiată”. Și de ce nu folosiți o altă placă din material dur? În acest caz, puteți face un fel de dosar (bine montat și lipit, astfel încât să nu se destrame) în forma unei cărți de două pagini și le puneți deasupra cărții pentru a fi fotografiate. Una dintre părțile laterale sau foile folderului va fi din material dur; iar cealaltă, fața de sticlă pe care o folosești pentru a face fotografia, pe pagina care te interesează.
    Spun.
    Mulțumesc pentru idee.

    răspuns
    • Buna ziua, multumesc frumos pentru comentariu

      da, este o idee foarte bună, adevărul este că metoda pe care am lăsat-o este foarte foarte simplă, pentru a digitaliza o carte. Dacă aveți de gând să faceți mult volum, ar trebui să facem câteva modificări pentru a putea merge mai repede :)

      Un saludo

      răspuns
  12. Mulțumesc, rezerv! De asemenea, am vrut să vă întreb și dacă există imagini sau grafică, cum o fac? Sunt imaginile integrate așa cum se vede în text? Sau cum ar trebui să fac dacă am text și imagini pe o pagină?

    răspuns
  13. Noapte bună.
    Mi-a plăcut postarea ta. Felicitări.
    Nu spun că l-am realizat pentru că am rămas în penultimul pas: aspectul.
    Fiule, am vrut să-mi tai venele de sute de ori, ce spun sute! ZECE !!!
    Fără glumă, mi-ai face o mare favoare dacă ne-ai spune despre procesul de layout. Acest lucru ar finaliza procesul dintr-o singură sursă.
    Vă încurajez să faceți acest lucru.
    Încă o dată, felicitări.

    răspuns
  14. Adevărul este că suportul și camera sunt o idee bună, dar am îndoieli în ceea ce privește scanarea mai întâi a celor pare și apoi a celor ciudate și a reordonării lor, deoarece cred că ar dura mult timp să o faceți manual sau să înveți să folosești programul hehe
    Spuneți, de asemenea, că, după realizarea fotografiei, aceasta este convertită în text, ceea ce nu este ca o fotocopie, deci pentru imagini sau casete de text așa cum ar fi, dacă ați putea pune rezultatul final mai bine.

    răspuns
  15. După părerea dvs., cu un telefon mobil (8Mpx), este mai bine cu bliț sau fără bliț într-o cameră cu lumină normală?
    Mulţumiri

    răspuns
    • Bună Eugenia, personal prefer o cameră foto, care rezolvă lumina pentru a fi utilizată destul de bine. Dacă este o cameră de telefonie mobilă, vă recomand lumina normală, dar nu directă. După o perdea albă care difuzează lumina de intrare sau cu lumina de după-amiază -într-o cameră din partea opusă de unde apune soarele-, deoarece blițul poate „arde” imaginea (adică poate ieși foarte albă) .
      În orice caz, cea mai bună opțiune este să treceți fotografia - recomandată, format JPEG - printr-un program de scanare OCR. De obicei, aceste programe rezolvă problemele pentru dvs.

      răspuns
    • Dacă folosiți sticlă pentru a netezi foile, blițul nu va permite realizarea fotografiei, deoarece va fi reflectată. La lumina zilei normale trebuie să fie mai mult decât suficient.

      atâta timp cât imaginile sunt clare, OCR funcționează foarte bine și detectează totul

      răspuns
  16. Buna! Aș dori să știu dacă aveți o foaie fotografiată pentru a vedea cum arată, deoarece camera nu o apreciază foarte bine, se pare că foaia nu este completă.

    răspuns
    • Această imagine nu este clară, trebuie să luați tot textul, ceea ce nu se vede în imagine nu va fi transformat de ocr, deci nu trebuie tăiate cuvinte. Voi face o fotografie și o voi încărca

      răspuns
  17. Felicitări, mi-a plăcut foarte mult ideea, am citit un comentariu în care să pun un suport pentru foaia care ne fotografiază. De exemplu, ați putea pune o hârtie cu coajă (carton gros) atașată la fundul paharului, care ar arăta ca un dosar și ar ajuta să o faceți un pic mai repede, nu-i așa?

    răspuns
  18. Dacă încadrați bine fotografia astfel încât să preia tot textul de pe foaie și pur și simplu nu aveți nevoie de carton, va funcționa la fel de repede. Dacă ți se pare dificil să încadrezi, poate fi o idee bună.

    răspuns
  19. Mulțumesc Nacho pentru tutorial.
    Când scanați o carte veche, foile ies gălbui, murdare, există vreo modalitate de a le curăța?
    salutări

    răspuns
    • Bună ziua Antonio. Dacă aveți de gând să-l treceți prin OCR, nu vă pasă, deoarece va păstra doar textul.

      Dacă aveți de gând să generați un pdf din imagini scanate, le puteți edita folosind Photoshop sau GIMP.

      răspuns

Lasă un comentariu