Să vedem cum se digitalizează o carte într-un mod foarte rapid și de casă.
Digitalizarea unei cărți constă întotdeauna din 2 părți, prima în care obțineți o imagine a textului și a doua în care această imagine este tratată cu un OCR, A Software de recunoaștere optică a caracterelor
În mod tradițional, cărțile erau scanate pagină cu pagină, acesta este un proces foarte lent, care a fost complex datorită coloanelor vertebrale ale cărților, care au curbat paginile și apoi OCR nu a recunoscut bine cuvintele. S-a observat că mulți oameni nu le leagă pentru a facilita procesul de scanare.
Deci, în loc să scanăm paginile, vom face fotografii. Lucrez cu o cameră compactă de 10 megapixeli, dar s-ar putea realiza chiar și cu un smartphone.
După cum puteți vedea, este un sistem foarte de casă și ieftin, dar chiar și așa, în mai puțin de o oră am avut o carte de 120 de pagini în format digital (fără aspect) și fără grabă.
Și nu credeți că acest lucru este folosit doar pentru a pirata cărți, că îl puteți folosi perfect pentru a digitaliza notele de curs și pentru a putea studia cu un cititor, iPad sau laptop.
Sistem de digitalizare a unei cărți
Noi vom avea nevoie
- Un singur aparat de fotografiat
- Un trepied
- Cartoane și bandă
- Un cristal
Primul lucru de făcut este să construim o platformă sau un lutru pentru a ține cartea și o vom face cu carton. Este foarte simplu
În imaginea de mai târziu, piesele, îmbinate cu bandă, sunt mai bine apreciate, cu excepția curelelor care creează rigiditate în structură, astfel încât să scoatem cele 2 bețe și să putem îndoi lutrul și să-l depozităm fără să-l ocupăm.
detaliul coloanei vertebrale este important. În funcție de grosimea cărții, ar trebui să o adaptăm astfel încât cartea să nu fie mai grasă și să nu aibă probleme.
Dacă vreți totul mestecat aici vă las măsurătorile celui pe care l-am construit. Merge în cm, iar x2, x4 este numărul de piese de care aveți nevoie pentru fiecare
Asamblarea digitalizatorului de carte
Vom folosi paharul pentru a ne aplatiza pagina de fotografiat, trebuie să aveți grijă la reflexiile sticlei, așa că cel mai bine este să o faceți cu lumină naturală și care cade din lateral.
și trebuie să puneți camera astfel încât să ia întreaga pagină, cât mai aproape posibil (utilizați zoom) și cât mai centrat.
După cum am spus, sticla este însărcinată cu lăsarea foii pentru a fi fotografiată plat, vom îndepărta pagina opusă, astfel încât să nu apară pe ecran și să-l lăsăm să fotografieze tot textul.
Dacă te uiți la această fotografie, ar fi prost realizată, deoarece nu ia textul integral
Toate marginile trebuie să fie vizibile, nu puteți tăia cuvintele, deci este foarte important să plasați bine camera pentru a obține imaginile
Cum pot face imaginile?
[evidențiat] Actualizez editarea imaginilor pas cu pas, care este un punct care nu este clar și mulți dintre voi mă întrebați [/ evidențiat]
Există mai multe metode și software care ne vor ajuta. Pentru mine, cel mai rapid și mai confortabil lucru este să fotografiez mai întâi paginile ciudate și apoi să le fac pe toate.
Le redenumim cu numerele de pagină pentru a le putea amesteca, acest lucru se poate face cu mai multe software-uri gratuite.
Și dacă doriți, puteți roti unul dintre cele 2 loturi, fie cele impare, fie cele pare, deoarece acestea vor fi aliniate în direcții opuse și în funcție de OCR pe care îl utilizați, este posibil să aveți probleme la identificarea textului.
Cum se rotește imaginile cu GIMP
Vom folosi GIMP, editorul de imagini software gratuit și un plugin numit BIMP cu care este obișnuit editați imagini în serie. Iată un videoclip despre cum s-ar face
Ce este un OCR?
Suntem în ultimul pas. rulați imagini prin OCR. OCR este un software de recunoaștere optică a caracterelor, ceea ce face este recunoașteți textul dintr-o imagine și convertiți-l în text scris pe care îl puteți salva ca document text, fie .doc .odt, fie în alte formate.
Cel mai bun pe care îl știu este Cititor bun Abby o adevărată minune, dar este plătită.
Odată ce totul a fost digitalizat, „numai” trebuie să facem un aspect, dar nu vom vorbi despre acest lucru în acest moment decât dacă ne interesează pe mulți dintre voi.
În cele din urmă, așa cum sigur cineva încearcă să vadă ce cărți erau în stivă, iată un detaliu ;-)
Cel mai rapid digitalizator de carte din lume
De unde știu că vă plac trivia aici dintr-un videoclip cu funcționarea celui mai rapid digitalizator de cărți din lume. Este BSF-Auto și este capabil să scaneze 250 de pagini pe minut
Aveți mai multe informații la http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/
Vă mulțumesc că ne-ați împărtășit această idee bună, eu sunt unul dintre cei care sfâșie hârtia pentru a o scana, deoarece este un motiv pentru spațiu, nu a fost o pierdere mare, dar am și alte copii pe care nu vreau să le scap. de și dacă le digitizez, vă mulțumesc din nou.
Mă bucur că ideea funcționează pentru dvs. și vă puteți păstra intacte volumele fizice ;-)
Dacă vă puteți gândi la o îmbunătățire, este întotdeauna binevenită.
Un saludo
O idee excelentă.
Cred că tutorialul reușește să comunice, dar îi lipsesc încă multe date, astfel încât orice nenorocit muritor să poată face ceea ce intenționează să predea aici.
Buna,
Am crezut că este foarte clar :-(
Spune-mi ce îndoieli ai și completează tutorialul.
Un saludo
Caut un suport, cumpărat sau construit, pentru mobil Samsung Note II. Am nevoie de el pentru a scana cărți și aparate foto lucide. Adică poziții verticale, înclinate și orizontale.
Bună, tutorial foarte bun și foarte original la fel, este simplu pentru cei care nu au scaner. Cer permisiunea să îl conectez de pe blogul meu.
Salutări.
Bună Roland.
Nicio problemă, dimpotrivă, linkurile sunt apreciate :)
Un saludo
Mulțumesc, acum îmi cer permisiunea de a copia întregul text pe blog, hehehe ... respectându-vă evident autoria și linkurile.
Salutări.
Salutari. Bună explicație și contribuție, în mod normal, o scanez, dar, cum spui, uneori cuvintele nu ies complet și este mai lent. Noroc
există un program ocr gratuit ocr gratuit. Nu este lapte, dar se descurcă destul de bine
Vă mulțumesc foarte mult pentru recomandare
O voi dovedi să văd asta :)
Arată excelent, voi încerca să-l modific și să-l fac mai eficient, am câteva cărți pe care aș dori să le convertesc în pdf: D
Potrivit lui Romodolfo, numele programului lipsește pentru a integra paginile pare și impare, deci ar fi foarte complet un factor de timp x preferăm să mestecăm întotdeauna mulțumim O îmbrățișare
Pentru cei care nu sunt obișnuiți să gestioneze serii de imagini, redenumirea și amestecarea fotografiilor pare și ciudate este confuză.
Dacă ați putea să-l detaliați puțin mai mult, ar fi bine.
Dacă aveți nevoie de un program pentru a redenumi paginile pare și impare, unul simplu pe care îl pot recomanda este «Lupas Rename 2000», pe care îl puteți găsi foarte ușor cu google.
Când am scanat cărți și, din moment ce scanerul meu a scanat doar o parte, mai întâi a scanat paginile impare și apoi paginile pare și, cu acel mic program, acestea sunt redenumite într-o clipă.
Un salut.
Pentru OCR, One Note funcționează bine, există „tutoriale” despre cum să o faceți:
Ofițerul este aici
Sper să te ajute, tutorele mă va servi „puțin” hahaha.
În ceea ce priveşte
Am nevoie să construiesc o cameră lucida de casă.
Gracias
camera lucida
Vă mulțumim pentru contribuție. Ei bine, este o cămilă risipitoare (lucru). Frate mulțumesc.
Acum povestea este să punem paharul la universitate, ha ha
Salut, foarte interesant. Am un reflex semi-profesional (un nikon!) Și acum știu ce să folosesc pentru asta, hehehe
Dar am o sugestie. Spui „folosește-ți mâna pentru a aplatiza foaia care nu va fi fotografiată”. Și de ce nu folosiți o altă placă din material dur? În acest caz, puteți face un fel de dosar (bine montat și lipit, astfel încât să nu se destrame) în forma unei cărți de două pagini și le puneți deasupra cărții pentru a fi fotografiate. Una dintre părțile laterale sau foile folderului va fi din material dur; iar cealaltă, fața de sticlă pe care o folosești pentru a face fotografia, pe pagina care te interesează.
Spun.
Mulțumesc pentru idee.
Buna ziua, multumesc frumos pentru comentariu
da, este o idee foarte bună, adevărul este că metoda pe care am lăsat-o este foarte foarte simplă, pentru a digitaliza o carte. Dacă aveți de gând să faceți mult volum, ar trebui să facem câteva modificări pentru a putea merge mai repede :)
Un saludo
Mulțumesc, rezerv! De asemenea, am vrut să vă întreb și dacă există imagini sau grafică, cum o fac? Sunt imaginile integrate așa cum se vede în text? Sau cum ar trebui să fac dacă am text și imagini pe o pagină?
Noapte bună.
Mi-a plăcut postarea ta. Felicitări.
Nu spun că l-am realizat pentru că am rămas în penultimul pas: aspectul.
Fiule, am vrut să-mi tai venele de sute de ori, ce spun sute! ZECE !!!
Fără glumă, mi-ai face o mare favoare dacă ne-ai spune despre procesul de layout. Acest lucru ar finaliza procesul dintr-o singură sursă.
Vă încurajez să faceți acest lucru.
Încă o dată, felicitări.
Adevărul este că suportul și camera sunt o idee bună, dar am îndoieli în ceea ce privește scanarea mai întâi a celor pare și apoi a celor ciudate și a reordonării lor, deoarece cred că ar dura mult timp să o faceți manual sau să înveți să folosești programul hehe
Spuneți, de asemenea, că, după realizarea fotografiei, aceasta este convertită în text, ceea ce nu este ca o fotocopie, deci pentru imagini sau casete de text așa cum ar fi, dacă ați putea pune rezultatul final mai bine.
După părerea dvs., cu un telefon mobil (8Mpx), este mai bine cu bliț sau fără bliț într-o cameră cu lumină normală?
Mulţumiri
Bună Eugenia, personal prefer o cameră foto, care rezolvă lumina pentru a fi utilizată destul de bine. Dacă este o cameră de telefonie mobilă, vă recomand lumina normală, dar nu directă. După o perdea albă care difuzează lumina de intrare sau cu lumina de după-amiază -într-o cameră din partea opusă de unde apune soarele-, deoarece blițul poate „arde” imaginea (adică poate ieși foarte albă) .
În orice caz, cea mai bună opțiune este să treceți fotografia - recomandată, format JPEG - printr-un program de scanare OCR. De obicei, aceste programe rezolvă problemele pentru dvs.
Dacă folosiți sticlă pentru a netezi foile, blițul nu va permite realizarea fotografiei, deoarece va fi reflectată. La lumina zilei normale trebuie să fie mai mult decât suficient.
atâta timp cât imaginile sunt clare, OCR funcționează foarte bine și detectează totul
Buna! Aș dori să știu dacă aveți o foaie fotografiată pentru a vedea cum arată, deoarece camera nu o apreciază foarte bine, se pare că foaia nu este completă.
Această imagine nu este clară, trebuie să luați tot textul, ceea ce nu se vede în imagine nu va fi transformat de ocr, deci nu trebuie tăiate cuvinte. Voi face o fotografie și o voi încărca
Felicitări, mi-a plăcut foarte mult ideea, am citit un comentariu în care să pun un suport pentru foaia care ne fotografiază. De exemplu, ați putea pune o hârtie cu coajă (carton gros) atașată la fundul paharului, care ar arăta ca un dosar și ar ajuta să o faceți un pic mai repede, nu-i așa?
Dacă încadrați bine fotografia astfel încât să preia tot textul de pe foaie și pur și simplu nu aveți nevoie de carton, va funcționa la fel de repede. Dacă ți se pare dificil să încadrezi, poate fi o idee bună.
Mulțumesc Nacho pentru tutorial.
Când scanați o carte veche, foile ies gălbui, murdare, există vreo modalitate de a le curăța?
salutări
Bună ziua Antonio. Dacă aveți de gând să-l treceți prin OCR, nu vă pasă, deoarece va păstra doar textul.
Dacă aveți de gând să generați un pdf din imagini scanate, le puteți edita folosind Photoshop sau GIMP.
Vă mulțumesc foarte mult pentru ajutor, a fost foarte util.