ウチの某案件で使うことになり
実際に触ってみました。
形態素解析はMeCabを使います。
■ MeCabインストール
- libiconv - 日本語パッチ
$ wget http://www2d.biglobe.ne.jp/~msyk/software/libiconv/libiconv-1.12-ja-1.patch.gz
- libiconv
$ wget http://ftp.gnu.org/pub/gnu/libiconv/libiconv-1.12.tar.gz
$ tar zxvf libiconv-1.12.tar.gz
$ cd libiconv-1.12
$ gzip -dc ../libiconv-1.12-ja-1.patch.gz patch -p1
$ ./configure
$ make
$ sudo make install
- QDBM
$ wget http://qdbm.sourceforge.net/qdbm-1.8.77.tar.gz
$ tar zxvf qdbm-1.8.77.tar.gz
$ cd qdbm-1.8.77
$ ./configure --enable-zlib
$ make
$ sudo make install
- MeCab
http://mecab.sourceforge.net/ から DL
$ wget --output-document=./mecab-0.97.tar.gz http://downloads.sourceforge.net/mecab/mecab-0.97.tar.gz?modtime=1202034262&big_mirror=0
$ tar zxvf mecab-0.97.tar.gz
$ cd mecab-0.97
$ ./configure --enable-utf8-only --enable-mutex --prefix=/usr/local/mecab
$ make
$ sudo make install
- mecab-ipadic
http://mecab.sourceforge.net/ から DL
$ wget --output-document=./mecab-ipadic-2.7.0-20070801.tar.gz http://downloads.sourceforge.net/mecab/mecab-ipadic-2.7.0-20070801.tar.gz?modtime=1185895550&big_mirror=0
$ tar zxvf mecab-ipadic-2.7.0-20070801.tar.gz
$ cd mecab-ipadic-2.7.0-20070801
$ ./configure --with-charset=utf8 --with-mecab-config=/usr/local/mecab/bin/mecab-config
$ make
※ libiconv.so.2 がない!と怒られたときは
/usr/local/mecab/lib 以下に、シンボリックリンクを張る
$ sudo ln -s /usr/local/lib/libiconv.so.2 ./libiconv.so.2
$ sudo make install
■ Hyper Estraier インストール
-- Hyper Estraier
$ wget http://hyperestraier.sourceforge.net/hyperestraier-1.4.13.tar.gz
$ tar zxvf hyperestraier-1.4.13.tar.gz
$ cd hyperestraier-1.4.13
$ ./configure --prefix=/usr/local/hyperestraier\
--includedir=/usr/local/mecab/include\
--libdir=/usr/local/mecab/lib\
--libexecdir=/usr/local/mecab/libexec\
--enable-mecab\
--enable-dlfilter\
--enable-regex
$ make
$ sudo make install
■ とりあえず動かす場合
1.適当なディレクトリを作ってスタティックコンテンツを置く$ mkdir /tmp/contents
※ 自分は、mysql に入っているデータから 1レコード=1ファイルの tsv を作って置きました。
2. ドキュメントルートにインデックスの作成
$ cd /var/www ( アタクシの環境の場合、/var/www )
$ sudo /usr/local/hyperestraier/bin/estcmd gather -il ja -sd /var/www/test_search /tmp/contents
3. apache のデフォルト cgi-bin ディレクトリに、cgiもろもろファイルをコピー
$ mkdir /usr/local/apache/cgi-bin/fts
$ cp /usr/local/mecab/libexec/estseek.cgi /usr/local/apache/cgi-bin/fts/
$ cp /usr/local/hyperestraier/share/hyperestraier/estseek.* /usr/local/apache/cgi-bin/fts/
$ vi /usr/local/apache/cgi-bin/fts/estseek.conf
以下の 2 点を変更
indexname: /var/www/test_search
replace: ^file:///home/nurai/test/full_text/contents/{{!}}http://1.my-staging.org/
4.ブラウザからアクセスhttp://1.my-staging.org/cgi-bin/fts/estseek.cgi
以上!
