• はてなブックマークに追加
  • Yahoo!ブックマークに登録
goo、Jetrun、kizasi…少数精鋭で新サービスを次々と生み出す ブログ検索の世界標準を狙う“企画屋”エンジニアたち
ブログは今や大事な情報源。そんなブログの普及に伴い、ブログ検索技術の開発に注目が集まっている。Web検索技術ではGoogleの独壇場となったが、ブログ検索技術の世界はまだ混沌としている。世界標準を目指して、日夜開発が行われているエンジニアの姿を追った。
(総研スタッフ/関洋子)作成日:06.08.30
Part1:ブログ検索技術の開発が盛んに行われる背景
ブログはもはや見逃せない情報源
 Tech総研でも日夜重要な情報を発信している(はず?)「Tech総研ブログ」。グーグルで「エンジニア」という言葉を検索すると、トップページに2件のブログ記事が表示されたことでもわかるように(2006年8月1日の検索結果)、いまやブログは、見逃すことのできない情報発信源となっている。発信している側の「いろいろな人に見てほしい」というニーズと、閲覧者側の「●●について書かれている記事を読みたい」「この情報を見落としたくない」というニーズの両者が高まってきたからこそ、精度の高いブログ検索技術が求められている。ポータルサイトの大手ヤフー、ロボット検索技術で事実上のデファクトとなった米グーグルまでもがブログ検索技術の開発に参入し、熱いバトルが繰り広げられている。
ブログ検索の技術開発は難易度が高い
 ブログ検索技術とWeb検索技術との最大の違いは、そこに記述されている文章を解析しているかどうかである。またWeb検索技術はある事象そのものについて調べるために用いられるが、ブログ検索はある事象についての個人のうわさや感想、意見などを調べる用途に用いられる。つまりWeb検索技術を絞り込みの検索とすれば、ブログ検索はつながりの検索と言い換えることができる。だからこそ、ブログ検索技術では、●●という言葉から連想されるイメージやコンテンツの中身を解析することが重要になる。ブログツールの提供により、誰もが簡単にブログを立ち上げ、情報発信できるようになった。中には、ニュースへのリンクだけ、アフィリエイトだけという不適切なコンテンツも数多い。それらのコンテンツを解析することでフィルタリングし、適切な情報を、いかに負荷をかけずに、素早く提供するかが重要なのである。

 さらなる違いは、技術開発に携わるエンジニアが、テキスト解析により得られた結果を「どう見せていくか」という点まで考えなければならない点だ。つまり、技術的な視点だけではなく、その技術を使ってどうやってユーザーを満足させるか、そのためにどんなサービスを展開していくか、という企画屋としての側面も求められているのである。
■Web検索技術とブログ検索技術の違い
 
Web検索技術
ブログ検索技術
使用目的
ある事象そのものについて調べる
ある事象についての個人の意見や感想を調べる
検索のタイプ
絞り込み
言葉のつながりや連携も重視
文章の意味解析
なし
あり(入力された日本語の意味を解釈し、検索する)
Part2:世界を目指して開発を進める、ブログ検索技術のエンジニアたち
 ブログ検索技術の世界では今、どのような開発が進められているのか。それに携わるエンジニアたちに、開発しているブログ検索技術の特徴と今後の展開、そしてこの技術に携わる理由、やりがいなどを聞いた。
Case1:goo 見せ方やデザイン面の提案もエンジニアの仕事
欲しい情報をいかに早く抽出できるか
 杉崎正之さんがブログ検索技術の開発に取り組み始めたのは、2004年である。NTT研究所でテキスト検索やWeb検索の周辺技術に携わっていた杉崎さんは当時、日本ではやっていた日記系サイトに着目していた。「日記系サイトの情報は、時間情報と文書(内容)に構造化できる。それらに関するデータベースをつくれば面白いことができるのではないだろうか」と考えていたという。それが、ブログ検索技術の開発に携わるきっかけとなった。

 gooのブログ検索技術の最大の特徴は、本文だけが抽出されること。一般的なブログサイトには本文だけではなく、その本文へ寄せられたトラックバックやコメント情報も掲載されている。何も指定せずに検索エンジンがサイトを巡回すると、トラックバックやコメントまでも検索対象としてしまう。「検索結果を開いてみると、トラックバックやコメントの情報でがっかりした、ということがないよう、本文抽出機能を搭載している」(杉崎さん)という。これは望まれている話題を的確に提供するための仕組みなのだ。
杉崎正之さん
NTTレゾナント株式会社
ポータル事業本部
技術マーケティング部
担当課長
杉崎正之さん

1970年生まれ。95年、東京理科大学大学院理工学研究科修了後、日本電信電話(NTT)に入社、研究所に配属される。テキスト検索エンジンの中でもテキストの自動分類やログ解析などの研究開発に携わる。2004年、NTTレゾナントに異動し、ブログ検索技術の開発に取り組む。
サービスをつくるエンジニアとして、見せ方も工夫する
 ブログ検索技術をより洗練させていくためには、「エンジンである自然言語解析や固有表現抽出の精度を高めていく必要がある」と杉崎さん。しかし取り組まなければならないのは、このような技術的課題だけではない。「多くのユーザーに使ってもらうためにも、デザイン的な部分や情報の見せ方についても、サービスをつくる技術者としては考えていかなければならないポイントだ」(杉崎さん)。

 昨年12月から今年の6月まで開設していた次世代型ブログ検索実験「BLOGRANGER」では、「トピック」「ブロガー」「リンク先」に加え「感想」という抽出軸を設けた。これも情報の見せ方の一つである。このように情報の見せ方について考えるのも、エンジニアの役割なのである。

「ここがかゆいなあ、と思ったら、そこに手が届くモノをいかに素早く提供できるかが重要なんです。つまり、この分野のエンジニアは考えたことをすぐ実行する、手を動かせる人でなければならない」と杉崎さんは語る。現在、gooが提供しているブログ検索は、鮮度を重視したつくりとなっているが、今年の秋ぐらいから「BLOGRANGER」で検証した結果を反映し、「評判」のような鮮度だけではない検索軸を設けたサービスを実験的に提供していくという。
「市場にインパクトを与えるような技術にしたい」。ユーザーからの反応がダイレクトに届く今年の秋からが、杉崎さんの新たな挑戦の始まりである。
BLOGRANGER
2005年12月から2006年6月まで開設していた次世代型ブログ検索実験「BLOGRANGER」の画面。検索した言葉に対して、トピック、ブロガー、リンク先、感想などの軸から選ぶことができる
gooブログ
gooブログの詳細検索画面。項目や最終更新日、対象サイト、検索結果の表示順、件数などの条件を細かく設定できる。
Case2:Jetrunテクノロジ 考えた工夫をつぎつぎと実装していく醍醐味
キーワードのつながりを見せる技術の開発に取り組む
 Jetrunテクノロジでブログ検索技術の開発、維持に携わっている島田俊一さんの前職は、VBやJavaのプログラミングの講師である。講師をしていただけあって、プログラミングの基礎がしっかりしていることと、そして新しいことに果敢に挑戦する意欲を併せ持っていたため、ブログ検索技術の開発にぴったり合う人材として、白羽の矢が立ったという。

 Jetrunテクノロジのブログ検索エンジンの特徴は、独自のタグ付け技術により、日付を指定するカレンダーサーチ機能や、検索対象を記事タイトルや本文、サイト名、作者名などを指定して検索できること。またこの技術をPCだけではなく、携帯にも展開していることである。

 現在、島田さんが開発しているのは、「文中からかかわりのあるものを集めて出す技術」という。例えばある芸能人について書かれているブログの中からキーワードを抽出し、それらがどのように連携しているか、マップのような形で見せていくことを考えているのである。「キーワードの関連を見せることで、きっと、面白い言葉のつながりが見えてくる。今まで知らなかった関連知識が収集できる、そんなインフラになる」と島田さんは期待する。
島田俊一さん
Jetrunテクノロジ株式会社
開発部
島田俊一さん

専門学校卒業後、JavaやVisual Basicなど業務系開発を中心としたプログラミングの講師となる。2年半、講師を続けた後、2004年1月に知人の紹介により、Jetrunテクノロジに入社。ブログ検索技術の開発に携わる。
自分の考えを実装できることが面白い
 関連するキーワードを集めて出す技術の開発でカギを握るのは、言語成分の解析技術だけではない。その解析結果をユーザーが見やすいように表現することも、重要なポイントとなる。しかも検索結果は1秒以内で返さないと、ユーザーには使われなくなってしまう。「当社は大手企業のように、サーバーを数百万台並べるような大規模な設備投資はできません。限られたリソースの中で検索結果を素早く表示するためにも、データベース設計をはじめ、さまざまな工夫が欠かせません」(島田さん)。

 ブログ検索技術の開発のいちばんの醍醐味は、「自分が考えていることをすぐに実現できることだ」と島田さん。「普通の文字だけでなく、ギャル文字やアスキー文字、顔文字などにも対応していきたい。そして当社のブログ検索技術を世界に通用するものに育てたい。まずはアジア市場からですね」
Jetrun
Jetrunテクノロジが開発したブログ検索エンジン。日付によるカレンダーサーチ機能のほか、検索対象を記事タイトル、本文、サイト名、作者名などを指定して検索できる

Jetrun
「エンジニア」という言葉でブログを検索。成分解析技術によるマイニングサーチにより、エンジニアとともによく使われている語が左に列挙される
Case3:kizasi フォークな話題が地球規模で連鎖する、その過程が見えるエンジン
もっと検索したい……興味が広がる検索エンジンを
 シーエーシーの技術研究センターでは、古くから自然言語処理に関する研究開発に取り組んでいた。kizasiで使われている技術「時系列共起パターン解析エンジン(Kizasi Search Engine)」を開発するきっかけは、3年前にさかのぼる。

 当時同部署のセンター長だった稲垣陽一さんは、「持っている技術を生かして次世代型の検索エンジンをつくりたい」と一念発起、同センターのメンバーだった瀬戸口光宏さんとともに研究開発プロジェクトを立ち上げた。当時、Web検索エンジンとしてはグーグルの独壇場。「あのような対象を絞っていき目的に到達するエンジンではなく、検索を通して興味が広がっていくエンジンができないものか」と稲垣さんは考えた。そこで思いついたのが静的な情報ではなく、日々変化するもの、つまり話題と話題の空間を対象とするサーチエンジン「Kizasi Search Engine」だった。

  「kizasi.jp」の最大の特徴は、話題の言葉をある瞬間において「伝わる力」と「質を変える力」という2つの力で計測。その結果をグラフ化するなど、わかりやすく表示することにある。
「例えば、昨年度の夏、きざし語ランキングの上位に“刺客”という言葉がきました。選挙の話題で語られている言葉だったのですが、同時に“面白い”という形容詞も頻出していた。つまり“刺客”という言葉は、これまでの選挙のイメージが変わるきざしを表しているととらえることができるんです」(稲垣さん)
世界中の言葉で展開し、話題の広がる様子を見てみたい
 kizasiではブログのクチコミをマーケティングに生かすツール「ブログクチコミサーチ」や、音楽情報に特化してブログとメディア情報をマッシュアップした「musicmarQ」など、さまざまなサービスを展開している。瀬戸口さんが主となって積極的に研究開発を進めているのが、モバイル向けサービス「kizasi mobile」だ。

「パソコンで展開しているkizasiを携帯向けにアレンジするだけではなく、携帯の特徴を生かして、話題の言葉について意見交換できるような仕組みも検討している」(瀬戸口さん)
「kizasiが今対象としているのは、日本語のブログだけですが、今後は世界中のいろんな言語を対象としていきたいですね。kizasiで扱うのはマスコミが出す一般的な話題ではなく、あるフォークな話題。それが世界に広がる様子が見えれば、またその言葉がもつ違った一面を発見できると思うんです。やりたいことは山ほどありますよ」(稲垣さん)
稲垣陽一さん
株式会社シーエーシー
KIZASI事業室
副室長 テクノロジー統括
稲垣陽一さん

大学卒業後、シーエーシー入社、システム開発部門を経て技術研究センターに配属。ナレッジベースシステムの研究開発を経て、3年前から次世代の検索エンジンの研究開発に取り組む。
瀬戸口光宏さん
株式会社シーエーシー
KIZASI事業室
エンジニア&テクノロジーディレクター
瀬戸口光宏さん

大学、大学院時代から人工知能やソフトコンピューティングなどの研究に携わる。シーエーシー入社後、技術研究センターに配属。データマイニングやテキストマイニングなどの研究開発を担当。3年前から、稲垣さんとともに次世代検索エンジンの開発に取り組む。
kizasi.jp
kizasi.jpのトップページ。キャプチャーしたのは8月2日。この日のブログでいちばん話題になったのは、「王監督退院」だった
ブログクチコミサーチ
マーケティング用途向けのサービス「ブログクチコミサーチ」の画面。2つのキーワードを指定して、それぞれの口コミ状況(kizasi)の相関関係などが分析できる
Part3:ブログ検索技術分野で生かせるスキルとは?
特別な技術的スキルは必要ない!?
 今回取材した3社では、現在、少数精鋭による開発が行われている。しかし、3社とも「やりたいこと、やらなければならないことを解決するには、要員は足りない」と口をそろえる。今はまだ研究開発の段階の採用ニーズが発生していないが、商用ベースに乗り始めると、ニーズは一挙に拡大する可能性がある。

 ではどんなスキル、経験があればこの分野に携わることができるのか。「自然言語解析や検索エンジンの知識がなければ、難しいのでは」と考える人も多いかもしれないが、意外にもそうではない。Case2で紹介した島田さんのように、プログラミングの経験があれば技術的な素養はクリアしているという。もちろん、gooではRuby、kizasiではC、C++というように、それぞれの検索技術によって開発言語には違いがある。しかしそれ以外に、技術面に関しては、特別なスキルは必要ないという。つまり、プログラミング経験があり、検索技術に興味のある人なら、誰でも参加できるチャンスがあるのだ。
面白いものを、世の中にないものを手掛けたいと思える人
 むしろ技術的なスキルより重視されるのが、面白いもの、世の中にないものを手掛けたいと思うチャレンジ精神。ブログ検索技術は「これが正解」という答えはまだない。kizasiのように「話題」をとらえるアプローチもあるし、gooのように本文検索により、いち早くユーザーが望んでいる話題を抽出するアプローチ、またJetrunテクノロジのように、タグ付け技術を利用した属性検索というアプローチもある。ユーザーにとって付加価値のある検索エンジンをいち早くつくるためには、面白いもの、世の中にないものを生み出していきたいという熱意が必要だからだ。
 日本で生まれた技術が、世界標準を狙えるこの分野。“企画力”のあるエンジニアが、今、求められている。
  • はてなブックマークに追加
  • Yahoo!ブックマークに登録
あなたを求める企業がある!
まずはリクナビNEXTの「スカウト」でチャンスを掴もう!
スカウトに登録する
  関洋子(総研スタッフ)からのメッセージ  
関洋子(総研スタッフ)からのメッセージ
[]
[]
 日ごろから検索エンジンをよく使っている私。当初、ブログ検索技術もそのように求めている情報を絞り込む技術だと思っていました。しかし、今回の取材を通して、ブログ検索技術は話題のきざしやある製品やニュースに対する評判や口コミ、キーワードのつながりを教えてくれる技術だとわかり、感動。ある話題が世界に広がっていく様子が見える──。実現できれば、インターネットに新たな価値が生まれそうですよね。
[]
[]

このレポートを読んだあなたにオススメします

“ヒーローエンジニア”を探せ!

ブログの話題を発見!「Kizasi Search Engine」開発者

“ヒーローエンジニア”を探せ!独創的発想で活躍している若手エンジニアを探し出して紹介するこのシリーズ!今回登場するのは、ブログに記された無数のコトバを時系列で…

ブログの話題を発見!「Kizasi Search Engine」開発者

実録 求人魂!知られざるエンジニア採用の舞台裏

Twitterで始まるコミュニケーションでエンジニア獲得

実録 求人魂!エンジニア採用の舞台裏昨年あたりから急速に普及しているTwitter(ツイッター)。今回の求人魂ではこのTwitterによる“つぶやき”をきっかけに、…

Twitterで始まるコミュニケーションでエンジニア獲得

発見!日本を刺激する成長業界

CMSを使ってみる、開発してみる、仕事にする?

発見!日本を刺激する成長業界高度な機能を盛り込んだWebサイトを、手軽に構築できるツールとして登場したCMS。今日では単なるデザインや機能実装だけでなく、E…

CMSを使ってみる、開発してみる、仕事にする?

Mashup Awards 5「Tech総研賞」受賞者インタビュー

Tech総研が選んだ「エンジニアライフ応援」アプリ

2009年11月に開催されたMashup Awards 5表彰式。今回はTech総研からも「エンジニアライフ応援」をテーマに特別…

Tech総研が選んだ「エンジニアライフ応援」アプリ

【緊急連載】大不況が何だ!逆境転職に成功したエンジニア奮闘記

サイトを徹底研究!自分を客観視してスピード内定へ

逆境転職に成功したエンジニア奮闘記不況下転職に成功したエンジニアたちを紹介していく短期集中連載企画。今回は、より上流工程でクライアントと直に接する業務を目指して今…

サイトを徹底研究!自分を客観視してスピード内定へ

広める?深める?…あなたが目指したいのはどっちだ

自分に合った「キャリアアップ」2つの登り方

「キャリアアップしたい」と考えるのは、ビジネスパーソンとして当然のこと。しかし、どんなふうにキャリアアップしたいのか、…

自分に合った「キャリアアップ」2つの登り方

この記事どうだった?

あなたのメッセージがTech総研に載るかも

あなたの評価は?をクリック!(必須)

あなたのご意見お待ちしております

こちらもお答えください!(必須)

歳(半角数字)
(全角6文字まで)
  • RSS配信
  • twitter Tech総研公式アカウント
  • スカウト登録でオファーを待とう!
スマートグリッド、EV/HV、半導体、太陽電池、環境・エネルギー…電気・電子技術者向け特設サイト

PAGE TOP