読者です 読者をやめる 読者になる 読者になる

nookのためのPDF化メモ

PDFのフォント埋め込み化

すでにあるPDFがフォントが埋め込まれていない場合は以下を試す。

gs -dSAFER -dNOPLATFONTS -dNOPAUSE -dBATCH -sDEVICE=pdfwrite\
 -sPAPERSIZE=letter -dCompatibilityLevel=1.4 -dPDFSETTINGS=/printer\
 -dCompatibilityLevel=1.4 -dMaxSubsetPct=100 -dSubsetFonts=true\
 -dEmbedAllFonts=true\
 -sOutputFile=/out/to/path.pdf\
 -f input/to/path.pdf

 
落ちたりするファイルもあるのでそんなときは以下。

acroread -toPostScript in.pdf
ps2pdf14 -dPDFSETTINGS=/prepress in.ps out.pdf

一度、psにしてしまう。pdf2psやpdftopsがあるが、acroreadが一番良さそうだった(フォント埋め込み的に)。
 

画像ファイルのPDF化

mkdir hoge
for x in *.jpg; do convert $x -normalize hoge/$x; done
jpeg2pdf hoge hoge.pdf

奥村先生の記事を参考に。
Okumura's Blog | Computer and Education
 

html,txtファイルのPDF化

これはWebブラウザで開くなりして、印刷 => PDF というのがよい。凄く手間が掛かるのがいやだなぁ。
コマンド一撃! ってやつがなくてがっかり。html2pdfやpisa、mozilla2psを試すが上手く行かず…。
 

PDFのタイトル、著者名修正

以下のツール発見。残念ながら日本語非対応。
lrf-epub-tools - Convert LRF (Sony BeBB) files to EPUB, PDF, RTF, and HTML. Also converts PDF and DOCX to EPUB. - Google Project Hosting
author-title.pdf というファイルの形式にすると書き換えてくれる。

java -Xms200M -Xmx300M -jar ~/apps/LRFTools-0.9.236.jar updfmd .

注:java6が必要らしい。指定するのはPDFが置いてあるディレクトリのパス。
 

PDFの連結

pdftkで連結可能。

$ pdftk *.pdf cat output out.pdf

あるWebページとあるWebページを別々にPDF化して、一緒にする、など出来て便利。

よく使う物

pdffontsやpdfinfoはよく使う。xpdfを入れれば入るはず。
pdffontsはフォントの情報が出てくる。

$ pdffonts bitmap_gc.pdf                                                                                                                                           [master]
 name                                 type              emb sub uni object ID
 ------------------------------------ ----------------- --- --- --- ---------
 OXXUWH+CMSY8                         Type 1C           yes yes no      20  0
 IFLCFF+IPAMonaPMincho-H              CID TrueType      yes yes no      17  0
 TSAUIE+IPAMonaGothic-H               CID TrueType      yes yes no      11  0
 YROGBO+CMBX12                        Type 1C           yes yes no      14  0

 
pdfinfoはPDFの情報。タイトルや著者名が見れられる。これがnook上で表示される。

$ pdfinfo bitmap_gc.pdf
Title:          (ja)Bitmap Marking for Ruby.pdf
Author:         nari
Creator:        Adobe Acrobat 9.1.0
Producer:       GPL Ghostscript 8.70; modified using iText 2.1.7 by 1T3XT
CreationDate:   Wed May 26 07:49:27 2010
ModDate:        Wed May 26 08:32:10 2010
Tagged:         no
Pages:          7
Encrypted:      no
Page size:      595 x 842 pts (A4)
File size:      709817 bytes
Optimized:      no
PDF version:    1.4

 

nookやばい

nookやばい(「やばい」とは「すごいよりもすごいこと」という意味である)。
これはちょっとイイデスネー。
 

不満

htmlやRSSを*簡単*にepub化したい(pdfでもいいのだけど)。
nookで読めるPDFを作るのは苦労する。

追記

a2ps(or gnome-u2ps)を使う方法で行けそう。

w3m -dump URL > in.txt && u2ps in.txt -o in.ps && ps2pdf in.ps out.pdf