キーワード検索がわかる (ちくま新書)を読みました。
仕事でXXとXXをマッチングさせるのに、全文検索が必要だ~っちゅうことになって。 Sennaとかを使っていろいろ試しています。
なんですが、そもそもそこで使われている技術要素というか。 『N-gram』とか『形態素解析』とか『シソーラス』とかって? っていう感じで、メタなところを勉強したいなとか思って会社の週報に書いたら、 この本いいですよってフィードバックをいただいた本。
とにかく、全てが噛み砕いて分かりやすく書いてあるので、
っていうか、別にエンジニア向けの本なわけじゃないので
物凄く腑に落ちるというか。
例もとても分かりやすくて。 だーいたいこんな感じなんだ~ってところがガッツリ分かります。
んで、今まで知らなかった、検索ノイズを省くための近接演算子が~とか。
インターネットでは情報が毎日膨れ上がっています。 その中から、いかに効率良く精度の高い情報を取得できるかってことが、 大事になっていくことは、これまで以上に大切なことになっていくことは間違いありません。
1~2時間でそのバックグランドにある技術要素を俯瞰的にみることができる本書は、 720円ですが、すっげーお得なお買い物な気がします。
Sennaは未来検索ブラジルというイカした名前の会社が作ったOSSプロダクト。 (2ちゃんねる の ひろゆき が取締役だったりします)
Sennaは「セナ」と読みます。アイルトン・セナが由来です。 (松田千奈とは関係ありません。そんな事いうと、年代がバレそうですがw)
そんなSennaも、こないだKeyValue Store勉強会に行ったときに、 後継のgroongaってのを開発してます~ってことで。 メンテのみで、開発自体はペンディングっていう形だそうです。
アイルトン・セナも好きだったし、名前からしてブラジル的な香りがただよっていて、 好きだったので、ちょっと残念です。
自分はブラジルという国が大好きで。 中学生の頃に数週間、サッカーしにブラジルに行ったことがあるのですが、 みんな、すぐ踊るし、すぐサッカーするし、めちゃめちゃ明るい。
1回くらい、リオのカーニバルにいって、踊り狂ってみたいなぁ。