Xa veremos como dixitalizar un libro dun xeito moi rápido e caseiro.
A dixitalización dun libro consta sempre de dúas partes, a primeira onde se obtén unha imaxe do texto e a segunda onde se trata esta imaxe cun OCR, unha Software de recoñecemento óptico de caracteres
Tradicionalmente, os libros dixitalizábanse páxina por páxina, trátase dun proceso moi lento que era complexo debido ás espiñas dos libros, que curvaban as páxinas e entón o OCR non recoñecía ben as palabras. Observouse que moita xente non os separaba para facilitar o proceso de dixitalización.