2007年10月13日土曜日

全文検索システム"Hyper Estraier"

スズキです。

現在取り組んでる案件で、サイト内検索機能があり、
久しぶりに、全文検索エンジンについて調べてみました。
(昔、Luceneやnamazuは使ったことあります)

で、これは、いいかも、
と思ったものが、表記の"Hyper Estraier"です。
http://hyperestraier.sourceforge.net/index.ja.html

いいかも、と思ったポイントは、

-Javaのバインディングがある
-クローラーがついてる
-Apacheのモジュール(mod_estraier)が存在
http://modestraier.sourceforge.net/index.ja.html
-PostgreSQLからも使える
http://pgestraier.projects.postgresql.org/
-Windowsのバイナリも配布している

といったところです。

今回の案件はTeedaで開発しているので、
Javaのバインディングは重要です。

あと、サイト内検索なので、クローラーがはじめからあると、
クローラー製作工数をカットできます。

Apacheのモジュールは
「Apache を通過した html を検索 DB に自動的に登録する」
というものです。
非常に興味深い機能です。

最後に、PostgreSQLからも使える、ですが、
しっくりくるようなら、今後のsuz-lab推奨DBを
MySQLから、PostgreSQLへの乗り換えることも考えます。

とりあえずは、Windowsのバイナリで実験です。
今週末も、盛りだくさんだなー。

--
blog: http://suz-lab.blogspot.com/

0 コメント: