Paano i-digitize ang isang libro

Vamos isang ver kung paano i-digitize ang isang libro sa isang napakabilis at homemade na paraan.

Ang digitizing ng isang libro ay palaging binubuo ng 2 bahagi, ang una kung saan makakakuha ka ng isang imahe ng teksto at ang pangalawa kung saan ang imahe na ito ay ginagamot sa isang OCR, A Software ng Pagkilala ng Optical Character

Digitize ang mga libro sa mga ebook

Ayon sa kaugalian, ang mga libro ay na-scan nang pahina, ito ay isang napakabagal na proseso na kumplikado dahil sa mga tinik ng mga libro, na kinurba ang mga pahina at pagkatapos ay hindi gaanong nakilala ng OCR ang mga salita. Natukoy na maraming tao ang nagbubuklod sa kanila upang mapadali ang proseso ng pag-scan.

Kaya sa halip na i-scan ang mga pahina ay kukuha kami ng mga larawan nito. Nagtatrabaho ako sa isang 10 megapixel compact camera, ngunit maaari pa itong gawin sa isang smartphone.

Paano i-digitize ang isang libro sa bahay

Tulad ng nakikita mo, ito ay isang napaka-gawang bahay at murang sistema, ngunit kahit na, sa mas mababa sa isang oras mayroon akong isang 120-pahinang libro sa digital format (nang walang layout) at hindi nagmamadali.

At huwag isipin na ginagamit lamang ito upang mag-hack ng mga libro, na magagamit mo ito nang perpekto upang gawing digital ang iyong mga tala sa klase at makapag-aral sa isang mambabasa, ipad, o laptop.

Sistema upang i-digitize ang isang libro

Kakailanganin namin

  • Isang photo camera
  • Isang tripod
  • Mga karton at tape
  • Isang kristal

Ang unang dapat gawin ay bumuo ng isang platform o lectern upang hawakan ang libro at gagawin namin ito sa karton. Ito ay napaka-simple

lectern para sa pag-digitize ng mga libro

Sa paglaon na pagbaril, ang mga bahagi, na sumali sa tape, ay mas pinahahalagahan, maliban sa mga strap na lumilikha ng tigas sa istraktura, kaya tinatanggal namin ang 2 sticks at maaari naming tiklop ang lectern at iimbak ito nang hindi sumasakop

kung paano gumawa ng isang karton na lectern

pamamahinga ng musika at mga piraso ng suporta

ang detalye ng gulugod ay mahalaga. Depende sa kapal ng libro dapat nating iakma ito upang ang libro ay hindi mas mataba at walang mga problema.

lectern digitize book na may camera

detalye ng lectern gulugod

Kung nais mo ang lahat ngumunguya dito ay iniiwan ko sa iyo ang mga sukat ng aking naitayo. Pumupunta ito sa cm, at ang x2, x4 ay ang bilang ng mga piraso na kailangan mo ng bawat isa

Plano na buuin ang lectern at gawing digital ang mga libro

Pag-iipon ng digitizer ng libro

Assembly upang i-digitize ang mga libro

Gagamitin namin ang baso upang patagin ang pahina upang kunan ng litrato, kailangan mong mag-ingat sa mga salamin ng baso, kaya pinakamahusay na gawin ito sa natural na ilaw at mahuhulog mula sa gilid.

at kailangan mong ilagay ang camera upang maabot ang buong pahina, hangga't maaari (gumamit ng zoom) at nakasentro hangga't maaari.

lumilikha ng mga ebook na may camera

Tulad ng sinabi namin, ang baso ay namamahala sa pag-iwan ng sheet upang makunan ng litrato nang malayo, ililipat namin ang kabaligtaran na pahina upang hindi ito lumitaw sa screen at hayaan itong kunan ng larawan ang lahat ng teksto.

Kung titingnan mo ang litratong ito, ito ay hindi magandang ginagawa, sapagkat hindi ito kukuha ng buong teksto

mga imahe para sa ocr

may sira na pahina para sa ocr

Ang lahat ng mga margin ay dapat na nakikita, hindi mo maaaring i-cut ang mga salita, kaya napakahalaga na ilagay ang camera nang maayos upang makuha ang mga imahe

Paano ko makukuha ang mga imahe?

[naka-highlight] Ina-update ko ang pag-edit ng mga imahe nang sunud-sunod, na isang punto na hindi malinaw at marami sa inyo ang nagtanong sa akin [/ naka-highlight]

Mayroong maraming mga pamamaraan at software na makakatulong sa amin. Para sa akin, ang pinakamabilis at pinaka komportable na bagay ay larawan muna ang mga kakaibang pahina, at pagkatapos gawin ang lahat.

Pinalitan namin ang pangalan ng mga ito sa mga numero ng pahina upang maihalo ang mga ito, magagawa ito sa maraming libreng software.

At kung nais mo maaari mong paikutin ang isa sa 2 mga batch, alinman sa mga kakatwa o kahit na, sapagkat makahanay ang mga ito sa kabaligtaran ng mga direksyon at depende sa ginagamit mong OCR, maaari kang magkaroon ng mga problema sa pagtukoy ng teksto.

Paano paikutin ang mga imahe gamit ang GIMP

Gumagamit kami ng GIMP, ang libreng editor ng imahe ng software at isang plugin na tinatawag na BIMP na nakasanayan na batch i-edit ang mga imahe. Narito ang isang video kung paano ito gagawin

Ano ang isang OCR?

Nasa huling hakbang na kami. magpatakbo ng mga imahe sa pamamagitan ng OCR. Ang OCR ay isang Optical Character Recognition software, kung saan ang ginagawa nito kilalanin ang teksto sa isang imahe at i-convert ito sa nakasulat na teksto na maaari mong i-save bilang isang dokumento sa teksto, alinman sa .doc .odt o sa iba pang mga format.

Ang pinakamahusay na alam ko ay ang Abby fine reader isang tunay na pagtataka, ngunit ito ay binabayaran.

Kapag na-digitize na ang lahat, "tanging" kailangan nating gumawa ng isang layout, ngunit hindi namin pag-uusapan ito sa kasalukuyan maliban kung interesado ito sa marami sa iyo.

Sa wakas, tulad ng tiyak na may isang taong sumusubok na makita kung anong mga libro ang nasa stack, narito ang isang detalye ;-)

mga libro sa eksperimento at DIY

Ang pinakamabilis na digitizer ng libro sa buong mundo

Kung paano ko malalaman na gusto mo ang mga bagay na walang kabuluhan dito mula sa isang video ng pagpapatakbo ng pinakamabilis na digitizer ng libro sa buong mundo. Ito ang BSF-Auto at may kakayahang mag-scan ng 250 mga pahina bawat minuto

Mayroon kang karagdagang impormasyon sa http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/

35 mga puna sa "Paano i-digitize ang isang libro"

  1. Salamat sa pagbabahagi ng magandang ideyang ito, isa ako sa mga nagwawasak ng papel upang i-scan ito, dahil ito ay isang dahilan para sa kalawakan na hindi ito naging isang malaking pagkawala ngunit mayroon din akong iba pang mga kopya na hindi ko nais na mapupuksa ng at kung idi-digitize ko sila, salamat ulit.

    Tumugon
  2. Natutuwa akong gumagana ang ideya para sa iyo at mapanatili mong buo ang iyong pisikal na dami ;-)

    Kung maiisip mo ang isang pagpapabuti, palaging malugod itong tinatanggap.

    Isang pagbati

    Tumugon
  3. Naniniwala ako na namamahala ang tutorial na makipag-usap ngunit wala pa rin itong maraming data upang ang anumang mortal wretch ay maaaring gawin kung ano ang inilaan nitong ituro dito.

    Tumugon
  4. Naghahanap ako ng isang suporta, binili o naitayo, para sa mobile samsung note II. Kailangan ko ito upang mag-scan ng mga libro at camera lucid. Iyon ay, patayo, hilig at pahalang na mga posisyon.

    Tumugon
  5. Pagbati po. Magandang paliwanag at kontribusyon, karaniwang ini-scan ko ito ngunit tulad ng sinasabi mo minsan ang mga salita ay hindi ganap na lumalabas at mas mabagal ito. Swerte

    Tumugon
  6. Ayon kay Romodolfo, ang pangalan ng programa ay nawawala upang isama ang pantay at kakaibang mga pahina, kaya't magiging kumpleto ito ng ilang x time factor na mas gusto namin ang chewing laging salamat Isang yakap

    Tumugon
  7. Para sa mga hindi sanay sa pamamahala ng serye ng mga imahe, nakalilito ang pagpapalit ng pangalan at paghahalo ng kahit na at mga kakaibang larawan.

    Kung maaari mo itong idetalye nang kaunti pa, magiging mabuti.

    Tumugon
  8. Kung kailangan mo ng isang programa upang palitan ang pangalan ng kahit na at kakaibang mga pahina, isang simpleng isa na maaari kong inirerekumenda ay "Lupas Rename 2000", na maaari mong makita ang napakadali sa google.

    Kapag nag-scan ako ng mga libro, at dahil ang isang scanner ay nag-scan lamang sa isang panig, na-scan muna ang mga kakaibang pahina at pagkatapos ay ang pantay na mga pahina, at sa maliit na programa ay pinalitan sila ng ilang sandali.

    Isang pagbati.

    Tumugon
  9. Salamat sa iyong input. Sa gayon, ito ay isang pag-aksay na kamelyo (trabaho). Salamat kapatid.
    Ngayon ang kwento ay ilagay ang baso sa pamantasan, ha ha

    Tumugon
  10. Kumusta, napaka-interesante. Mayroon akong isang semi propesyonal na reflex (isang nikon!) At ngayon alam ko kung ano ang gagamitin para dito, hehehe
    Ngunit may mungkahi ako. Sasabihin mong "gamitin ang iyong kamay upang patagin ang sheet na hindi makunan ng litrato." At bakit hindi gumamit ng isa pang plato ng ilang matigas na materyal? Sa kasong iyon, maaari kang gumawa ng isang uri ng folder (maayos na nakakabit at nakadikit, upang hindi ito magkalayo) sa hugis ng isang dalawang pahina na libro, at inilalagay mo sila sa tuktok ng libro upang makunan ng larawan. Ang isa sa mga gilid o sheet ng folder ay magiging ilang matigas na materyal; at ang iba pa, ang mukha ng baso na ginagamit mo upang kunan ng larawan, sa pahina na iyong kinagigiliwan.
    Sabi ko.
    Salamat sa ideya.

    Tumugon
    • Kumusta, maraming salamat sa komento

      oo ito ay isang napakahusay na ideya, ang totoo ay ang pamamaraan na naiwan ko ay napaka-basic, upang i-digitize ang isang libro. Kung gagawa ka ng maraming lakas ng tunog dapat kaming gumawa ng ilang mga pagbabago upang mas mabilis na makapunta :)

      Isang pagbati

      Tumugon
  11. Salamat, inireserba ko! Gayundin nais kong tanungin ka, at kung may mga imahe o grapiko, paano ko gagawin? Ang mga imahe ba ay isinama tulad ng nakikita sa teksto? O paano ko dapat gawin kung mayroon akong teksto at mga imahe sa isang pahina?

    Tumugon
  12. Magandang gabi.
    Mahal ko ang post mo. Binabati kita
    Hindi ko sinasabi na nakamit ko ito dahil nanatili ako sa huling hakbang na hakbang: Ang layout.
    Anak, nais kong gupitin ang aking mga ugat ng daan-daang beses, ano ang sinasabi ko daan-daang! TENS !!!
    Walang katatawanan, gagawin mo sa akin ang isang malaking pabor kung sinabi mo sa amin ang tungkol sa proseso ng layout. Makukumpleto nito ang proseso mula sa iisang mapagkukunan.
    Hinihimok ko kayo na gawin ito.
    Muli, binabati kita.

    Tumugon
  13. Ang totoo ay ang suporta at ang camera ay isang magandang ideya, ngunit may pag-aalinlangan ako sa bagay na i-scan muna ang mga pantay at pagkatapos ay ang mga kakaiba at muling pag-ayos sa kanila dahil sa palagay ko mahaba ang oras upang magawa ito sa pamamagitan ng kamay o upang malaman na gamitin ang programa hehe
    Sinasabi mo rin na pagkatapos ng pagkuha ng larawan ay nai-convert ito sa teksto, na hindi katulad ng isang photocopy, kaya para sa mga imahe o kahon ng teksto tulad nito, kung mas mailalagay mo ang huling resulta.

    Tumugon
  14. Sa iyong palagay, sa isang cell phone (8Mpx), mas mahusay ba ito sa flash o walang flash sa isang silid na may normal na ilaw ng araw?
    Salamat

    Tumugon
    • Kumusta Eugenia, Mas gusto ko ng isang camera, na malulutas ang ilaw upang magamit nang maayos. Kung ito ay isang camera ng cell phone, inirerekumenda ko ang normal na ilaw ng araw, ngunit hindi direkta. Matapos ang isang puting kurtina na nagkakalat ng ilaw sa pasukan o sa ilaw ng hapon - sa isang silid sa kabaligtaran mula sa kung saan lumulubog ang araw-, dahil ang flash ay maaaring "sunugin" ang imahe (iyon ay, maaari itong lumabas napakaputi) .
      Sa anumang kaso, ang pinakamahusay na pagpipilian ay upang ipasa ang litrato - inirerekumenda, format na JPEG - sa pamamagitan ng isang programa sa pag-scan ng OCR. Kadalasan ang mga programang iyon ay malulutas ang mga problema para sa iyo.

      Tumugon
    • Kung gumagamit ka ng baso upang makinis ang mga sheet, hindi papayagan ng flash na kunan ng larawan, dahil masasalamin ito. Sa normal na ilaw ng araw dapat itong maging higit sa sapat.

      hangga't matalas ang mga imahe, gumagana nang napakahusay ang OCR at nakita ang lahat

      Tumugon
  15. Kamusta! Nais kong malaman kung mayroon kang isang nakunan ng litrat upang makita ang hitsura nito, dahil hindi ito pahalagahan ng kamera nang mabuti, tila hindi kumpleto ang sheet.

    Tumugon
  16. Binabati kita, nagustuhan ko talaga ang ideya, nabasa ko ang isang puna kung saan upang maglagay ng suporta para sa sheet na kinukunan ng litrato sa amin. Halimbawa, maaari kang maglagay ng isang shell paper (makapal na karton) na nakakabit sa ilalim ng baso, na magiging hitsura ng isang folder at makakatulong ito upang mas mabilis itong gawin, hindi ba?

    Tumugon
  17. Kung na-frame mo nang maayos ang larawan nang sa gayon ay tumatagal ng lahat ng teksto sa sheet at hindi mo lamang kailangan ang karton, gagana ito nang napakabilis. Kung nahihirapan kang mag-frame, maaaring ito ay isang magandang ideya.

    Tumugon
  18. Salamat Nacho para sa tutorial.
    Kapag nag-scan ka ng isang lumang libro, ang mga sheet ay lumabas na madilaw-dilaw, marumi, mayroon bang paraan upang linisin ang mga ito?
    tungkol

    Tumugon
    • Kumusta Antonio. Kung papasa ka sa OCR, wala kang pakialam sapagkat panatilihin lamang nito ang teksto.

      Kung makakabuo ka ng isang pdf mula sa na-scan na mga imahe, maaari mong i-edit ang mga ito gamit ang Photoshop o GIMP.

      Tumugon

Mag-iwan ng komento