hishidaの開発blog

EBシリーズ(EBPocket,EBWin,EBMac,EBStudio),KWIC Finder,xdoc2txt,読書尚友の開発者ブログ

EBWin(EBMac,EBPocket)のMDict対応進捗(1)

EBWin4(EBMac,EBPocket)のMDict対応、第一週目の進捗について。
(今週はカメラと写真の展示会CP+2016に行ってきたので、作業時間が少なめでした)
MDict1.2と2.0の構造の解析、キーワードと本文のダンプ出力、ランダムアクセスまで可能になった。
これまでのところ問題になったのは:

  • 暗号化のハッシュキーの生成に、あまり見かけないripemd128が使われている。ライセンス的に問題のないソースが見つかったので組み込んで解決。
  • ver1.2では圧縮にzlibではなくlzoが使われているが、lzoのライブラリはGPL2しか見つからない。しかたないので動的ライブラリにしてライセンス問題を回避する予定。(goldendictもそうなっているので、この方法がダメならみんなダメだ。)
  • 公開されているMDictの中国語辞書のエンコードがBig5だった。Big5からUnicodeへのマッピングテーブルを探さないといけない→未解決。日本で言えばShiftJISの辞書を公開するようなもの。やっぱりMDictは中国人の辞書ですよ。

残り作業は、

  • 検索APIの作成。
  • Big5からUnicodeへの変換
  • Compact形式と呼ばれる独特のスタイル記法の解釈
  • 本文中のジャンプ
  • マルチメディアへの対応

以上ができればEBWin4への組み込みが可能になるが、まだ1〜2ヶ月かかる見込み。
休日天気がよいと写真を撮りにでかけてしまう(hishidaの写真ブログ)ので、気長にお待ちいただければ幸いです。