Como digitalizar um livro

Vamos ver como digitalizar um livro de forma muito rápida e caseira.

Digitalizar um livro sempre consiste em 2 partes, a primeira onde você obtém uma imagem do texto e a segunda onde essa imagem é tratada com um OCR, tem Software de reconhecimento óptico de caracteres

Digitalize livros em e-books

Tradicionalmente, os livros eram digitalizados página por página, esse é um processo muito lento e complexo devido às lombadas dos livros, que curvavam as páginas e o OCR não reconhecia bem as palavras. ntat que muitas pessoas os desvincularam para facilitar o processo de digitalização.

Assine nossa lista de discussão

Então, em vez de escanear as páginas, vamos tirar fotos dele. Trabalho com uma câmera compacta de 10 megapixels, mas poderia até ser feito com um smartphone.

Como digitalizar um livro em casa

Como vocês podem ver, é um sistema bem caseiro e barato, mas mesmo assim, em menos de uma hora eu tinha um livro de 120 páginas em formato digital (sem layout) e sem pressa.

E não pense que isso é usado apenas para hackear livros, que você pode usá-lo perfeitamente para digitalizar suas anotações de aula e poder estudar com um leitor, ipad ou laptop.

Sistema para digitalizar um livro

Nós vamos precisar

  • Uma câmera de fotos
  • Um tripé
  • Papelão e fita adesiva
  • Um cristal

A primeira coisa a fazer é construir uma plataforma ou púlpito para segurar o livro e vamos fazer com papelão. É muito simples

púlpito para digitalização de livros

Na tomada subsequente, as peças, unidas com fita adesiva, são melhor valorizadas, exceto pelas tiras que criam rigidez na estrutura, por isso retiramos os 2 paus e podemos dobrar o púlpito e guardá-lo sem ocupar

como fazer um púlpito de papelão

descanso musical e peças de apoio

o detalhe da coluna é importante. Dependendo da espessura do livro devemos adaptá-lo para que o livro não fique mais gordo e não tenha problemas.

púlpito digitaliza livro com câmera

detalhe da lombada do púlpito

Se você quer tudo mastigado aqui, deixo para vocês as medidas daquele que construí. Vai em cm, e x2, x4 é o número de peças que você precisa de cada uma

Plano para construir o púlpito e digitalizar livros

Montagem do digitalizador de livros

Montagem para digitalizar livros

Vamos usar o vidro para achatar a página para fotografar, tem que ter cuidado com os reflexos do vidro, por isso é melhor fazer com luz natural e que caia de lado.

e você tem que colocar a câmera de forma que ela ocupe a página inteira, o mais próximo possível (use o zoom) e o mais centralizado possível.

criar e-books com uma câmera

Como já dissemos, o vidro se encarrega de deixar a folha para ser fotografada plana, vamos afastar a página oposta para que ela não apareça na tela e deixá-la fotografar todo o texto.

Se você olhar para esta fotografia, ficaria mal feito, porque não leva o texto completo

imagens para o ocr

página defeituosa para ocr

Todas as margens devem estar visíveis, você não pode cortar as palavras, por isso é muito importante posicionar bem a câmera para obter as imagens

Como faço para tirar as imagens?

[destaque] Estou atualizando passo a passo a edição das imagens, que é um ponto que não está claro e muitos de vocês me perguntam [/ destaque]

Existem vários métodos e softwares que nos ajudarão. Para mim, o mais rápido e confortável é fotografar primeiro as páginas ímpares e depois todas as pares.

Nós os renomeamos com os números das páginas para poder misturá-los, isso pode ser feito com vários softwares livres.

E se você quiser, pode girar um dos 2 lotes, pares ou ímpares, porque eles serão alinhados em direções opostas e dependendo do OCR que você usar, poderá ter problemas para identificar o texto.

Como girar imagens com o GIMP

Usaremos o GIMP, o editor de imagens de software livre e um plugin chamado BIMP que é usado para edição em lote de imagens. Aqui está um vídeo de como isso seria feito

O que é um OCR?

Estamos na última etapa. execute imagens por meio de OCR. OCR é um software de reconhecimento óptico de caracteres, que faz reconhecer texto em uma imagem e convertê-lo em texto escrito que você pode salvar como um documento de texto, seja .doc .odt ou em outros formatos.

O melhor que sei é o Abby boa leitora uma verdadeira maravilha, mas é paga.

Depois que tudo estiver digitalizado, "apenas" temos que fazer um layout, mas não vamos falar sobre isso no momento a menos que seja do interesse de muitos de vocês.

Finalmente, como certamente alguém está tentando ver quais livros estavam na pilha, aqui está um detalhe ;-)

livros de experimentos e DIY

Digitalizador de livros mais rápido do mundo

Como eu sei que você gosta das curiosidades aqui de um vídeo da operação do digitalizador de livros mais rápido do mundo. É o BSF-Auto e é capaz de digitalizar 250 páginas por minuto

Você tem mais informações em http://www.k2.t.u-tokyo.ac.jp/vision/BFS-Auto/

32 comentários sobre "Como digitalizar um livro"

  1. Obrigado por compartilhar esta boa ideia, eu sou daqueles que rasgam o papel para escanear, pois é motivo de espaço não foi uma grande perda mas também tenho outros exemplares que não quero desfazer de e se eu digitalizá-los, obrigado novamente.

    resposta
  2. Fico feliz que a ideia funcione para você e você possa manter seus volumes físicos intactos ;-)

    Se você puder pensar em alguma melhoria, é sempre bem-vindo.

    Uma saudação

    resposta
  3. Acredito que o tutorial consegue se comunicar, mas ainda faltam muitos dados para que qualquer avarento mortal possa fazer o que se pretende ensinar aqui.

    resposta
  4. Procuro um suporte, comprado ou construído, para um telemóvel Samsung Note II. Eu preciso escanear livros e câmera lúcida Ou seja, posições verticais, inclinadas e horizontais.

    resposta
  5. Saudações. Boa explicação e contribuição, normalmente eu faço a varredura, mas como você diz às vezes as palavras não saem completamente e é mais lento. Sorte

    resposta
  6. Segundo Romodolfo, falta o nome do programa para integrar as páginas pares e ímpares, por isso ficaria muito completo algum fator x tempo preferimos mastigar sempre obrigado Um abraço

    resposta
  7. Para quem não está acostumado a gerenciar séries de imagens, renomear e misturar fotos pares e ímpares confunde.

    Se você pudesse detalhar um pouco mais, tudo bem.

    resposta
  8. Se você precisa de um programa para renomear páginas pares e ímpares, um simples que recomendo é "Lupas Rename 2000", que você pode localizar facilmente com o google.

    Quando eu escaneio livros, e como meu scanner escaneia apenas um lado, primeiro ele escaneia as páginas ímpares e depois as páginas pares, e com aquele pequeno programa elas são renomeadas em um momento.

    Uma saudação.

    resposta
  9. Obrigdo por sua contribuição. Bem, é um camelo inútil (trabalho). Obrigado irmão.
    Agora a história é colocar o copo na universidade, ha ha

    resposta
  10. Olá, muito interessante. Eu tenho um reflexo semi-profissional (um nikon!) E agora eu sei o que usar pra ele, hehehe
    Mas tenho uma sugestão. Você diz "use a mão para alisar a folha que não vai ser fotografada". E porque não usar outra placa de algum material duro? Nesse caso, você pode fazer uma espécie de pasta (bem montada e colada, para que não se desfaça) no formato de um livro de duas páginas, e colocar em cima do livro a ser fotografado. Um dos lados ou folhas da pasta será de algum material duro; e a outra, a face de vidro que você usa para tirar a foto, na página que lhe interessa.
    Eu digo.
    Obrigado pela ideia.

    resposta
    • Olá, muito obrigado pelo comentário

      Sim, é uma ideia muito boa, a verdade é que o método que deixei é muito básico, de digitalizar um livro. Se você vai aumentar muito o volume, devemos fazer algumas alterações para poder ir mais rápido :)

      Uma saudação

      resposta
  11. Obrigado, eu reservo! Também queria perguntar a você, e se houver imagens ou gráficos, como faço? As imagens estão integradas como se vê no texto? Ou como devo fazer se tiver texto e imagens em uma página?

    resposta
  12. Boa noite.
    Adorei sua postagem. Parabéns.
    Não estou dizendo que o alcancei porque fiquei no penúltimo passo: o layout.
    Filho, eu quis cortar minhas veias centenas de vezes, o que posso dizer centenas! DEZ !!!
    Sem brincadeira, você me faria um grande favor se nos contasse sobre o processo de layout. Isso completaria o processo de uma única fonte.
    Eu encorajo você a fazer isso.
    Mais uma vez, parabéns.

    resposta
  13. A verdade é que o suporte e a câmera é uma boa ideia, mas tenho dúvidas em escanear primeiro os pares e depois os ímpares e reordená-los, pois acho que demoraria muito para fazer manualmente ou aprender a fazer use o programa hehe
    Você também fala que depois de tirar a foto ela é convertida em texto, o que não é como uma fotocópia, então para imagens ou caixas de texto como seria, se você pudesse colocar o resultado final melhor.

    resposta
    • Olá Eugenia, pessoalmente prefiro uma câmera, que resolve bem a luz a ser usada. Se for uma câmera de celular, recomendo luz do dia normal, mas não direta. Depois de uma cortina branca que difunde a luz de entrada ou com a luz da tarde - em uma sala do lado oposto de onde o sol está se pondo -, pois o flash pode "queimar" a imagem (ou seja, pode sair muito branco) .
      Em qualquer caso, a melhor opção é passar a fotografia - formato JPEG recomendado - por um programa de digitalização OCR. Normalmente esses programas resolvem os problemas para você.

      resposta
    • Se você usar vidro para alisar as folhas, o flash não permitirá que a foto seja tirada, porque ela será refletida. À luz do dia normal, deve ser mais do que suficiente.

      contanto que as imagens sejam nítidas, o OCR funciona muito bem e detecta tudo

      resposta
  14. Olá! Gostaria de saber se tem uma folha fotografada para ver como fica, já que a câmera não aprecia muito bem, parece que a folha não está completa.

    resposta
  15. Parabéns, gostei muito da ideia, li um comentário para colocar um suporte para a folha que nos fotografa. Por exemplo, você poderia colocar uma cartolina (papelão grosso) presa ao fundo do vidro, que se pareceria com uma pasta e ajudaria a torná-lo um pouco mais rápido, não é?

    resposta

Deixe um comentário