なんとなく

なんとなく書きます

PDFのストリームについて

ストリームのオブジェクトの構造は大体こう

x y obj<>stream[改行]
[data][改行]
endstream
endobj

ストリームのデータサイズは、[data]の長さで[改行]は含まないとのこと。
[改行]は「CR+LF」or「LF」とのこと。

※CR:0x0d LF:0x0a

改行コードによりstream~endstream間の大きさが異なるので
読み飛ばすときには注意が必要。
しかも、改行コードはファイル内でも統一されてるとは限らないっぽい。
めんどくさい。

Lengthの値を後ろで参照させる場合有(/Length xx yy R)
この場合は大抵ストリームの後ろにあるので読み飛ばせずに
ストリームを読み続けるしかないのか?
また調べよう。
先に入れて欲しいなー。


フィルターとかについては、またいつか。