Texto puro em eBook: um pequeno tutorial

No fim do ano passado fiz um cursinho online de Python no Coursera. Provavelmente esqueci a maior parte do que aprendi, mas pelo menos já sei mais ou menos como me guiar na linguagem caso precise fazer algo com ela. O que me motivou a fazer esse curso foram os livros. Converter um PDF de alguma edição fora de catálogo era algo próximo de viver o inferno, mas eu meio que tomei gosto pela coisa e queria arranjar formas mais eficazes de processar todo esse texto que extraía desses livros, e foi assim que surgiu este pequeno script.

E como entre alguns amigos eu virei uma espécie de referência quando se trata disso — uma atividade que eu transformei num tipo muito estranho e masoquista de hobby —, resolvi fazer aqui um tutorialzinho de como criar ebooks a partir do momento em que você já tem o texto pronto e processado, porque a parte de aprontar o texto é muito chata e ninguém em sã consciência além de mim e alguns malucos tem paciência para essa primeira parte. Talvez renda um texto futuro, mas não tenho muita certeza. Uma coisa que aprendi nos últimos vinte e sete anos e meio é que não se deve esperar muita coisa de mim.

Vamos lá. Você vai precisar de:

  • O programinha Calibre instalado em seu computador
  • Conhecimento básico em HTML e CSS

Abra o Calibre e clique em “Adicionar livros” e depois em “Adicionar um livro vazio (uma entrada de livro sem nenhum formato)”. Vai aparecer a janelinha da imagem abaixo depois, e você preenche — ou não, isso também pode ser preenchido depois — conforme a necessidade.

tuto-calibre-1

O livro recém-criado vai aparecer em sua biblioteca como um livro comum, mas se você abrir ele vai estar… erm… vazio. Clique nele com o botão direito e depois em “Edit book” (sim, a tradução do Calibre é meio cagada). Uma segunda janela será aberta. Aí você pode acrescentar arquivos em html, fontes, imagens etc, no seu novo livro. Recomendo usar um arquivo HTML pra cada capítulo, e para cada elemento pré e pós-textual. E, claro, usar as tags HTML semanticamente — ou seja, direitinho: H1 pra título geral, H2 pra títulos principais, H3 pra subtítulos, P pra parágrafos etc. Você também pode definir classes e estilos em CSS pra deixar a parada mais bonita, como por exemplo formatar blocos de citação e epígrafes de capítulos.

A imagem abaixo é do arquivo da edição brasileira de “A Dialética do Sexo” que eu converti em ebook no fim do ano passado. Deu um trabalho do cão pois o texto estava com o OCR cagado e o scan não estava muito legível; fora que o programa de OCR que usei não era lá muito bom com língua portuguesa. Tive que reescrever boa parte do texto.

tuto-calibre-2

A parte mais chata de transformar esses livros velhos em ebook é fazer as referências e as notas de rodapé: tem que fazer links com âncora, e se o livro tiver muita nota você pode se confundir bonito nessa parte. Quando converti o volume dois d’O Segundo Sexo em ebook cometi um erro no começo e ele foi “herdado” por boa parte do livro; tive que fazer tudo de novo, então recomendo bastante cuidado nessa parte.

tuto-calibre-3

Dicas

  1. Esse livro criado do zero vai estar em formato ePub — o formato aberto aceito pelos leitores digitais em geral, inclusive o Kobo. Pra ler no Kindle, é só ir na biblioteca, clicar com o lado direito do mouse e mandar o Calibre converter o arquivo no formato mobi.
  2. Use o Word para fazer a revisão do texto: mesmo que você tenha que corrigir certos termos você mesmo — em inglês por exemplo —, ele vai marcar o que estiver estranho no texto e vai ser mais fácil de encontrar essas ocorrências e revisar.
  3. tuto-calibre-4O botãozinho “Verificar livro” no editor de livros do Calibre é mágico. Ele vai procurar incongruências no seu código e ajudar a corrigir se alguma tag HTML estiver fora do lugar.

Isto fica feliz em ser útil. Até amanhã! o/

Join the Conversation

1 Comment

Leave a comment

Your email address will not be published. Required fields are marked *