hishidaの開発blog

EBシリーズ(EBPocket,EBWin,EBMac,EBStudio),KWIC Finder,xdoc2txt,読書尚友の開発者ブログ

xdoc2txt 2.0 alpha


xdoc2txt 2.0 alphaをリリースした。改良点は、

  1. 内部Unicode対応。出力オプションに -u(UTF16)、-8(UTF-8)を追加。
  2. PDFに /LZWDecodeのサポートを追加(Unisys特許が切れているため)。
  3. cryptlib.dll を統合し、パスワード無で暗号化されたPDFに標準で対応した。
  4. iFilterの利用が可能になった(-i オプション)。xdoc2txtでネイティブサポートしていない文書でも、iFilterが存在すればテキスト抽出ができる。
  5. コマンドライン版と、Dll版を提供する。C#VB.Net からDllを呼び出すためのサンプルも添付。

iFilterは、Microsoft Officeaパック、一太郎DocuWorks、PDFが使える。ただしPDFは、Adobe Reader9.5付属のiFilterでないと呼び出せない。(Adobe Reader 10以降は普通のiFilterとして呼び出せなくなった。単独配布されている6.0のiFilterは異常終了する。Adobe Reader 9.5以前の、Readerと一緒に配布されているiFilterなら使えると思う。)

大幅な改修を行っているので、これまで1.xを同梱していたアプリケーションが2.0を同梱する場合、再度検証していただくよう、お願いします。