CloudSearchが多言語対応してTokyoリージョンに!Suggesterを試してみる

本日、↓のアナウンスがございましたが、CloudSearchの大きなローンチがありました。 【AWS発表】Amazon CloudSearch 大幅アップデート - 1ヶ月100ドル以下でより良い検索が可能に!日本語にも対応!   日本語に対応したマネージドな検索エンジンが東京リージョンで使えるということで、早速試してみたいと思います。 お題は、先日書いた、SolrのSuggesterを試してみる | shinodogg.comのCloudSearch版ということで。   ドメインを作る   ManagementConsoleからDomainをCreateします。

  ドメインの名前は取り敢えず、、、。 で、インスタンスタイプとレプリケーションの数が選べます。

  ドメインスキーマ定義はCSVファイルから。

  CSVファイルの名前は山手線の名前で。

  今回のローンチでAnalysis Schemeのところで"Japanese"が選べるようになりました!

  IP制限の設定などして、ドメイン構築が終わるのを待ちます。

    ■ Suggesterの設定   続いて、新機能のSuggesterを追加します。 ユルく当てたり、Solr記法でソートの順番が変えられたりします。

  Suggester用のインデクシングが必要な旨、表示されます。

  ドメインダッシュボード画面に戻ると"Run Indexing"が表示されます。

  インデクシングを走らせてしばし待ちます。

    ■ データを投入します   肝心のデータを入れてませんでした…w こちらも先ほどの山手線のCSVファイルをアップロードします。

  29ドキュメントありますよー、と。

  実際にはSDFというCloudSearch用の形式でデータは投入されるのですが、 CSVから変換されたSDFをダウンロードすることが出来ます。 中身みると↓こんな感じ。

  29ドキュメントのaddがSuccessだったよ、と。

    ■ クエリを試してみる   Run a Test Search で Suggester を先ほど上記で設定した yamanote にします。

  平仮名で入力しても漢字の駅名が表示されます。

  "しん"で新橋が出てこないなぁって思ったら、

  なるほど、そういう事なのね、、と。日本語奥深いです。。

  こちら、いろいろと重宝しそうかなと思っていますヽ(´▽`)ノ     ■ Developer Guide   ↓ボリュームのあるドキュメントがあるので、今度も特徴のある機能などをピックアップして紹介したいと思います。 http://docs.aws.amazon.com/cloudsearch/latest/developerguide/what-is-cloudsearch.html http://awsdocs.s3.amazonaws.com/cloudsearch/latest/cloudsearch-dg.pdf     ■ 掃除   上記のスクリーンショットでエンドポイントとか晒してしまったので、ドメインを削除しておきます〜