SolrのSuggesterを試してみる

以前、Solrの勉強会で大須賀さんがデモしていた↓がナイスだったので自分も試してみました。 [slideshare id=30600250&w=427&h=356&fb=0&mw=0&mh=0&style=border:1px solid #CCC; border-width:1px 1px 0; margin-bottom:5px; max-width: 100%;&sc=no]

アルファベットだったら、レーベンシュタイン距離で近いのでホゲホゲ、でOKだけど、 日本語の場合は、ひらがな/かたかな/漢字ってことで、単純に距離では図れませんがな、と。   さっそくhttps://github.com/mosuka/solr-suggester-demo-uiをcloneしてくると、 その名の通り、UIのとこだけですねん、と。当たり前ですが、コレでは何も動きません…。

$ ls
README.md   css     index.html  js

  中身をみていくと、大きく2つに分かれています。 1. TermsComponentでAutoComplete & SpellCheckComponentで、Did you mean? 2. SuggesterでAutoComplete & Suggesterで、Did you mean?   jsディレクトリはjQueryが入ってるだけなのでイジる必要はなさそです。cssもそんな感じ。 ってことで、サーバーの構築をしていきます。     ■ Solrのインストール   最新版のSolrを落としてきて解凍して、

$ curl -O http://mirrors.gigenet.com/apache/lucene/solr/4.7.0/solr-4.7.0.tgz
  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current
                                 Dload  Upload   Total   Spent    Left  Speed
100  144M  100  144M    0     0   576k      0  0:04:17  0:04:17 --:--:--  385k

  exampleのディレクトリ行って、jar叩くだけです。

cd solr-4.7.0/example
java -jar start.jar

  localhost:8983にいくと↓のようなリンクが出てきて、   ↓叩くとソレっぽい画面が出てくるかな、と。   左側のメニューでCoreをcollection1に選ぶと今回のヤツになります。     ■ Solrの設定ファイルの配置   http://www.rondhuit.com/download.htmlに、"[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン"というリンクがあって、   そちらをダウンロードしてくると solrbook-2.zip というファイルが保存されます。 sampledata/suggesterの中に以下の3つのファイルがありますが。 1. conf/schema.xml 2. conf/solrconfig.xml 3. samplesuggester.xml   1.と2.に関しては、そのまま上記でダウンロード&インストールしたSolrの↓に突っ込んで上げて、

solr-4.7.0/example/solr/collection1/conf/

  3.は、(何かイケてないですが)Solrの管理画面から直接突っ込みました。     Githubから落としてきた静的コンテンツの配置   わざわざこのためにApacheとかも何だかなと思ったけど、warファイルの中にホゲホゲとかもアレだし、、 といってググってみたらQiitaでナイスなの見つけました↓ jetty で静的コンテンツを有効にして起動するまで(http://qiita.com/amay077/items/546b85cb74e9b2f1f928)   こちらを、そのまま拝借させていただいて↓のディレクトリ作ってファイルを置いてやります。

solr-4.7.0/example/htdocs/suggester

    ■ Suggesterの動作確認   Termコンポーネントだと"新"って漢字で入れないとアレですが、 Suggester使えば平仮名やカタカナでも出てきますよ、と。       ■ その他   現在、出張でシアトルに来てるのですが、オフィスに犬連れてきてるヤツがいてナイスな感じだったりします(´▽`) 座席も広々してるしなー  

[改訂新版] Apache Solr入門 ~オープンソース全文検索エンジン (Software Design plus)
大谷 純 阿部 慎一朗 大須賀 稔 北野 太郎 鈴木 教嗣 平賀 一昭
技術評論社
売り上げランキング: 11,651