xdoc2txt 2.0 alphaをリリースした。改良点は、
- 内部Unicode対応。出力オプションに -u(UTF16)、-8(UTF-8)を追加。
- PDFに /LZWDecodeのサポートを追加(Unisys特許が切れているため)。
- cryptlib.dll を統合し、パスワード無で暗号化されたPDFに標準で対応した。
- iFilterの利用が可能になった(-i オプション)。xdoc2txtでネイティブサポートしていない文書でも、iFilterが存在すればテキスト抽出ができる。
- コマンドライン版と、Dll版を提供する。C# とVB.Net からDllを呼び出すためのサンプルも添付。
iFilterは、Microsoft Officeaパック、一太郎、DocuWorks、PDFが使える。ただしPDFは、Adobe Reader9.5付属のiFilterでないと呼び出せない。(Adobe Reader 10以降は普通のiFilterとして呼び出せなくなった。単独配布されている6.0のiFilterは異常終了する。Adobe Reader 9.5以前の、Readerと一緒に配布されているiFilterなら使えると思う。)
大幅な改修を行っているので、これまで1.xを同梱していたアプリケーションが2.0を同梱する場合、再度検証していただくよう、お願いします。