|
|
2009年12月に日本版をリリースした「Google音声検索」。携帯電話のマイクを耳とし、電話で話すように単語を伝えるだけで、テキストに変換してGoogle検索を実行する音声検索。これを日本デビューさせた井上睦氏に「3度の飯より好きだ」というイノベーションについて語ってもらった。
(取材・文/中川隆太郎 総研スタッフ/宮みゆき 撮影/佐藤聡)作成日:10.03.10
|
3度の飯よりもイノベーションが好きと公言して憚らない井上氏。日本語ならではの多くの課題に直面したGoogle音声検索プロジェクトでも、イノベーションを起こすため、エンジニアと一緒に様々なチャレンジを行った。
大学で人工知能や経営工学を学び、2008年にGoogleに新卒入社。入社前から希望していたモバイル担当のアソシエイト プロダクトマネージャーとなり、Googleマップやストリートビューを携帯電話でも使えるようにしたりと、数多くのプロジェクトをリード。Google音声検索の日本語版プロジェクトもそのうちの一つである。
「Wow!」、「技術の進歩がここまで来たとは」、「こんなことまで認識できた!信じられない」、「まじ凄いな、この精度」、「携帯は音声で検索が普通になるかも」……。 インターネット上で驚きの声や感動が次々と投稿されるようになったのは2009年の12月。話題のもとはGoogle音声検索。2008年秋の英語版リリース、そして中国語版に続き、日本語版が満を持してリリースされたのだ。その立役者の一人が井上氏。当時まだ新卒入社2年目にも関わらず、プロダクトマネージャーの役割を任されたというから驚きである。 「米国で開発している時から、日本でもやったら面白いんじゃないかという話はあったんです。でも、すでに色々な音声認識が発表されていたにも関わらず流行っていないこと、そもそも日本人はシャイだからという意見等もあり、議論を重ねるにとどまっていました。日本語版のプロジェクトが大きく動き出したのは英語版のリリース後。過去の音声認識とは別次元の精度やスピードに、私もこれならいけるという確信を持てました。日本における携帯検索の調査・分析も行い、外だけでなく家でもテレビを見ながらとか、様々な場面で使われているとわかったのも大きかったです」 ボトムアップで新しいプロジェクトがどんどん立ちあがっていくのがGoogle流。この時も、日本のモバイル担当である井上氏と米国の研究者が議論を重ねる中で、「面白そうだ。ぜひやろう」という運びになったという。チームのコアメンバーは井上氏と日本語に強いリサーチサイエンティストのマイクシュスター、それとソフトウェアエンジニアの中島氏(※3月24日公開記事に登場)の3人。少人数だが、これもまたGoogleでは当たり前。コミュニケーションがとても簡潔で、自ら「やりたい」と思って参加しているメンバーだけに、大きな力を発揮できるのだ。 「もちろん、全てを3人で行ったわけではありません。周りには多くのエンジニアやチー ムがいて、インタラクションするのがGoogleの組織の面白いところ。チームとしては分かれていても、必要に応じてコミュニケーションを取りますし、そのハブ役となるのがプロダクトマネージャーです」 |
プロダクトマネージャーは実際に開発を行うことはないが、プロジェクト全体を見る上で技術的なバックボーンは欠かせない。他チームとの連動性や相互性のコントロールを行いながら、技術的な課題も解決し、プロジェクトをゴールへと導く。 「最大のチャレンジは訓練データの収集。最初に学習させる大量の単語音声を、どのような手段で、どこから集めるか。元となるデータの質や量がそのまま製品の完成度へとつながるだけに、絶対に妥協したくありませんでした。データを購入するといった選択肢もある中で、チームで議論を重ね、効率的に収集できるツールを自分たちで作ることに。その上で、音声認識分野で実績ある企業とパートナーシップを組み、一緒にデータ収集を行ったのです。結果として、理想通りのデータ収集を行うことができました」 英語版による音声検索のコア技術はすでにあったものの、日本語はその特殊さ故に課題も多かったと言う。例えば、漢字、ひらがな、カタカナがあり、セグメンテーションが難しいのも英語との大きな違い。そういった数々の課題を、エンジニアと一緒にアイデアを出し合いながら、一つ一つ確実に解いていった。 「今まで文字だった検索が音声でも一応できますといったレベルではなく、文字検索以上の利便性をユーザーに提供したかったんです。こだわったのは、認識精度∞スピード∞検索≠フ3つ。特に認識精度はこれまで発表された音声認識サービスの弱点でもあったので、何としてもクリアしようと思いました。スピードに関しても、文字入力より検索結果の表示が遅くては本末転倒です。また、音声検索を使う時は意図がはっきりしているケースが多いですから、検索結果もより最適なものでなければいけません。目指したのは、携帯電話のマイクを、言葉を理解する耳にすることでした」 実際にGoogleの音声検索を使えば、その思いが全て実現されていることがわかる。かなりマニアックなものも含めた膨大な語彙をサポートしながら、飲み屋や街頭の喧噪の中でも正確に認識。声の入力から検索結果が返ってくるまでにかかる時間もわずか数秒。住所を言えば地図を、「○○駅から○○駅」と言えば乗換案内を検索結果として表示。従来のGoogle検索以上の価値を提供したのだから、ユーザーが驚き、感動するのも無理はない。。そして、認識精度等をさらに高めていくためのアップデートを繰り返し、今も進化を続けている。 |
「世界中の情報を整理し、世界中の人々がアクセスできて使えるようにする」というGoogleのミッションは有名だが、それを実現していく上でもモバイルは重要な役割を果たす。例えば、子供が好きな動物の名前を言って、その動物の写真を見ることも可能だ。井上氏もGoogleに入社する前からモバイルならではの大きな可能性に惹かれていた。それだけにモバイルに対する情熱は人一倍強い。 「携帯電話にはマイクだけでなく、カメラやスピーカー、GPSとセンサーになりえる様々な機能がついています。そんなセンサーリッチな携帯電話とGoogleのクラウド技術を組み合わせることで、まだまだできることがたくさんあると思っています。Google音声検索ではマイクを耳にすることに挑戦しましたが、カメラを目にして、撮った写真で検索を行うことも不可能ではありません。新しい世界が待っていると思うとワクワクしますし、それを自分達の手で実現していきたいんです」 井上氏にとって、イノベーションは非常に前向きで楽しいもの。たとえ課題がたくさんあったとしても、チャレンジできる場がたくさんあることに過ぎない。そして、そんなイノベーションを楽しむ姿勢が開発に伝播し、ユーザーにもワクワク感として伝わるのだ。 |
このレポートに関連する企業情報です
独自の検索エンジンを使った情報提供、各種インターネットサービスや広告サービスの提供など続きを見る
このレポートの連載バックナンバー
人気企業の採用実態
あの人気企業はいま、どんな採用活動を行っているのか。大量採用?厳選採用?社長の狙い、社員の思いは?Tech総研が独自に取材、気になる実態を徹底レポート。
このレポートを読んだあなたにオススメします
グーグルエンジニア4人が語る「世界を変える私のイノベーション」Vol.4
Googleエンジニア中嶋海介の「20代で一生現役宣言」
「Google音声検索」開発において、最大のチャレンジだった膨大な訓練データの収集。だが、わずか1週間ほどで自前の収集ツールを開…
グーグルエンジニア4人が語る「世界を変える私のイノベーション」 Vol.2
大手携帯キャリアとGoogle検索提携を成功に導いた韓剛
Googleならではのイノベーションを生み出すGooglerたち。今回登場するのは、テクニカルアカウントマネージャーとして大手携…
“グーグリー”な人が、クラウド時代を切り拓く
Google辻野社長が語る、2015年のITワールド
昨年はAndroidや音声検索、また今年はChrome OSのリリースを予定するなどIT業界のみならず、世の中の注目を集める技術…
新ターゲットの日本で、日本のエンジニアを大量採用!
今はジャパンブーム★Googleに入りたい人は集まれ!
あのGoogleが本格的なエンジニア採用に乗り出した。常に優秀なエンジニアを募集している同社だが、今回のターゲットはビジネスが急…
グーグルエンジニア4人が語る「世界を変える私のイノベーション」Vol.1
日本独自のGoogleロゴを描く川島優志のイノベーション
Googleならではのイノベーションとは何か。4人のエンジニアやクリエイターが、主導したプロジェクトを題材に、それぞれの視点で語…
僕たち私たちの転職忍者の術★31
バレないようにコッソリ転職活動したいでござる の巻
在籍中に転職活動をする場合、今の会社にバレないようこっそり慎重に進めたいもの。ときには家族や友人にも内緒で活動したいケ…
あなたのメッセージがTech総研に載るかも