• はてなブックマークに追加
  • Yahoo!ブックマークに登録
なぜソフトが人間のように歌い、考え、判断する事ができたのか?「人間の知性を超えるソフト」を創る日本人技術者たち
「早く大量の計算をする」だけだった時代から、今や人間のさまざまな機能や制御を代替するようになってきているコンピュータ。そんななか、「歌う」「ゲームする」など、特に“人間らしい”機能を追求するソフトウェアの開発に迫ってみた。
(文/川畑英毅 総研スタッフ/根村かやの イラスト/大寺聡)作成日:08.01.10
Part1 ソフトはこんな「人間の知性」を目指している
ますます「人間らしく」なる機械

 2007年11月28日から12月1日まで、有明の東京ビッグサイトで開催された、「2007国際ロボット展」。産業用ロボットや、「お手伝い」や「掃除」のロボット、あるいはこれからのロボットの機能を探る実験用の機体など、さまざまな出展が見られた。
 産業用ロボットでは、ただ流れてきた部品を相手に、それこそ“機械的”に単一の動きをするのではなく、今や相手のサイズや形からロボット自らが「判断」をして、自在に姿勢を変化させながら、適切な作業を行うのが主流。特に今回のロボット展では、これまではやはり人間の役割と思われてきたような、例えば製品の目視検査を高速・自動で行うロボットなども目に付いた。
 そんなふうに、ロボットやIT家電の制御でも、あるいはコンピュータ上で操作するソフトウェアでも、「これが機械のすることなの?」と思うようなものが次々に登場してきている。

人間に迫り、人間を超える

 古典的SFでよく使われる「電子頭脳」という言葉にも表れているように、コンピュータは人間の頭脳の機能(の一部)を代替・拡大するもの。
 とはいっても、今のところその能力は、突き詰めれば「計算処理する」だけ。しかし、今や恐ろしく高速・膨大になったその処理能力に、さまざまなアルゴリズムを組み合わせれば、「考え、判断すること」や、あるいは「やはり人間じゃないと」と思われてきたようなその他の作業も可能になってくる。さらには「これまで人間じゃなければできなかったこと」に、「コンピュータじゃないとできないこと」を組み合わせて、思いがけない機能や強みを発揮することも。
 今回は特に、「人間に迫る」「人間を超える」ことが目的のソフトウェアをクローズアップ。人の機能を“追いかける”開発の難しさと面白さをインタビューしてみた。
Part2 「人間の知性を超えるソフト」とその創り手たち
人間のように歌うVOCALOID2:本格的バーチャル・アイドル誕生

 2007年秋以降、動画投稿サイトを中心にブレイク中なのが、「バーチャル・アイドル歌手を自宅でプロデュース」をうたい文句に発売された「キャラクター・ボーカル・シリーズ」第一弾の「初音ミク」(クリプトン・フューチャー・メディア株式会社)。
 メロディと歌詞を入力すれば、そのとおりに歌ってくれるソフトウェアで、サイト上では、既存の歌だけでなくオリジナル曲を作って歌わせたり、歌に合わせて2Dや3Dのアニメを自作してみたりと“百花繚乱”。ついに12月には、そんなオリジナル曲のひとつが「歌手名:初音ミク」で通信カラオケで配信されるまでに。

 そんなバーチャル・アイドルの基幹となっている音声合成エンジンが、ヤマハが開発した「VOCALOID」(現在は改良版のVOCALOID2」)である。そもそもここまでの大ヒット、開発時には予測していた?

剣持秀紀氏
剣持秀紀氏
ヤマハ株式会社
イノベーティブテクノロジー開発部  サウンドテクノロジー開発センター
SAグループマネジャー
「はっきり言って、予想外でした。
 楽器の音は、現在既にコンピュータである程度合成できる。唯一残されたものが人間の『歌声』で、ヤマハとし ても挑戦しなければと開発を始めたのですが、当初は音楽関係の方が、インストゥルメンタルの曲に仮にボーカル を入れる“仮歌”にでも使ってもらえれば、という感じでしたから。
『初音ミク』のヒットは、キャラクターや声のかわいさもあるでしょうが、ネット上での活躍を見たときは、私自身 面白さと楽しさで大ウケ。中にはオリジナルの歌で『ヤマハの技術は世界一』なんて歌っていただいているものま であって……いや、気恥ずかしいですけれど(笑)」(ヤマハ株式会社 剣持秀紀氏)
“歌声の追求”はエンドレス

 音声合成は、1961年、米国のベル研究所がその物理モデルを発表するなど、古くから研究されてきたテーマ。テキスト音声の合成では、読み上げソフト、カーナビのアナウンスなどで実用化もされている。

「しかし、音が明瞭で意味が通ればいいテキストと違って、歌はなかなかうまくいきませんでした。人の声は、声帯の振動だけではなく、呼気の乱流、共鳴などさまざまな要素がある。しかも、常時耳にしている音でもあるので、わずかな不自然さも耳につきます。
 VOCALOIDでは、音声そのものは実際の人の歌の“素片”をデータベース化、この歌声ライブラリをつなぎ合わせることで“歌わせる”ことを可能にしています。歌詞がきちんと聞き取れるようにしつつ、音のつながりを自然にする――特にこのつなぎ合わせ方が焦点でした。歌には“伸ばし音”があり、そこが美しくつながらないと歌は成り立たない。音素と音素の境界をうまく“合わせ込む”技術開発が必要でした。
「初音ミク」(写真左)と「鏡音リン・レン」
VOCALOID/VOCALOID2を使った製品は数社から出ているが、2007年8月の発売直後から大ヒットしたのがクリプトン・フューチャー・メディアの「初音ミク」(写真左)。同社からは12月27日に第2弾「鏡音リン・レン」も発売。
 もうひとつ重要なのがタイミング。例えば『シー』と歌い出すことを考えると、楽譜どおりの場所で突然声が出るのではなく、その100〜300ミリ秒前に、すでに『sh』音が出始めています。そんな部分も押さえないと、なかなか自然な歌声にはならないんです」

 VOCALOIDの開発は2000年にスタートし、2003年春に発表。その後、発音の明瞭さ、声の表情のコントロールしやすさ、操作性に改良を加えたVOCALOID2が登場、「初音ミク」に搭載されているのは、この新バージョンのほうである。

「ここまで広く一般のユーザーに使っていただけると思っていなかったので、操作画面もどちらかといえば玄人向け。今後はそのあたりも気を使わないと。ただ、VOCALOIDの本質はあくまで“歌を歌わせる”こと。もっともっと音質をよくしていかないといけない。思いがけずたくさんの皆さんに評価していただきましたが、現時点では、まだ人の歌声の『口の動かし方』と『音色』をマネしているだけ。歌とは、まだ、こんなものじゃない!
 具体的には、“シャウト”や“だみ声”などは、今のVOCALOIDにはできないし、実際の歌手の“歌い回し”も含めて再現するには、今の方式では無理で、新たなブレイクスルーが必要でしょう。まさにエンドレスの作業になると思っています」
人間のように対局する:第1回UEC杯コンピュータ囲碁大会

「ゲームをさせる」というのはコンピュータ黎明期からあるアプローチ。それは単に興味本位ではなく、ソフトウェア技術、とりわけ人工知能研究の進化に一役買ってきた。
 特にチェスでは1996年、IBMの「ディープ・ブルー」が時の世界チャンピオン、G・カスパロフに初勝利。このときは1勝を挙げただけだったが、その後も進化を続け、現在では、世界チャンピオンと互角に指せるまでになっているという。
 では、日本の将棋や、さらに複雑とされる囲碁への“コンピュータの挑戦”はどうなのだろうか。2007年12月に開催されたソフトウェア同士の大会、「第1回UEC杯コンピュータ囲碁大会」の運営委員長を務めた電気通信大学助教、伊藤毅志氏にお話を伺った。

 「将棋のソフトウェアは、今、実力的にはアマトップクラスといったところ。特に一昨年登場した、物理化学研究者保木邦仁さん開発の『ボナンザ』が突破口になり、あと5〜10年くらいでプロのトップクラスに迫れるかといわれています。
伊藤毅志氏
伊藤毅志氏
電気通信大学 電気通信学部 情報工学科 助教
工学博士
 一方で囲碁のほうは、現在はアマ初段くらいでしょうか。人間のトップクラスに迫るには、あと20〜30年は必要というのが一般的な評価です。
 ルール上指せる『合法手』の数が、チェスでは10の120乗。それに対し将棋は10の220乗、囲碁になると10の320乗にも達します。囲碁は、碁盤の目が19×19もあり、そのどこにでも石を打てるわけですから、格段に複雑。特に最近はマシンパワーの向上もあり、チェスや将棋では指し手をとことん探索する手法でうまくいっていますが、囲碁は手が多すぎて、それではうまくいかないのです」

  そこで囲碁ソフトウェアの場合、単に「手を探索」するのではなく、「人の知識を植え込む」ことで進化をとげてきた。しかしその知識は膨大で、ひとつの影響力関数を入れるとほかに悪影響を与えるといったこともあり、ある程度は強くなったものの、5、6年ほど伸び悩みの状態が続いていたのだという。
「モンテカルロ法」でブレイクスルー

「しかし2年ほど前のこと。フランスで『モンテカルロ法』によるアプローチを導入したソフトが開発され、これがブレイクスルーになりました。その後、ほかの開発者も次々にこの手法を導入、現在、ソフトウェアがめきめきと強くなっているところです。今回のUEC杯コンピュータ囲碁大会でも、上位5位までのうち4つまでがモンテカルロ法を使ったソフトウェアでした」

 モンテカルロ法とは、乱数を用いて行うシミュレーションや数値計算の手法のことで、実測が難しい解析で近似値を求めることによく使われる。例えば、正方形に内接する円を描き、この正方形内にランダムに点を置いていき、円の中にその点がいくつ入るかを確認、その結果から円周率の近似値を求める、といった計算が比較的有名だ。

「第1回UEC杯コンピュータ囲碁大会」
2007年12月1日、2日に開催された「第1回UEC杯コンピュータ囲碁大会」(主催:電気通信大学エンターテイメントと認知科学研究ステーション)の模様。フランスから招待の2チームのものを含め、28プログラムが対局した。
「モンテカルロ法では、すべての手を探索するのではなく、ランダムに手を選んで、それが勝ちにつながる確率を計算します。一つひとつの処理が軽いので、コンピュータへの負担も小さい。とはいえ、ただ乱数を使うというだけではうまくいかないので、ゲームに特化させた乱数シミュレーションのアルゴリズム、簡単なパターン知識なども付加します。
 シミュレーションの回数が多ければ多いほどいいので、ソフトの『強さ』はマシンパワーを如実に反映するのですが、効率よくシミュレーションするためのパターン選択には、やはり開発者の工夫やノウハウがモノを言います」

 こうした新しい手法の登場で、「囲碁ソフトウェアが人を超える日」はさらに近付いたのだろうか。
「現在の状況から、開発者の中には『むしろ将棋より早いかも』とおっしゃる人もいます。ただ、ソフトウェアはやはり“コンピュータならでは”の癖や弱点があって、そこを突かれると弱い。特に、癖を見抜くのはやはり人間のほうが得意ですからね。ですから、強くなったとはいえ、人間が本気でコンピュータ対策をして勝負に臨めば、まだまだソフトウェアは分が悪いというのが正直なところです。
 モンテカルロ法によるソフトはランダムアプローチなので、人ならあり得ない打ち方をすることもあります。また『勝ち負け』だけを判断するので、勝てるとなれば0.5目勝ちでもいいという打ち方をする一方、負け始めると『同じ負けでも惜敗がいい』という判断をしないため、大崩れすることも多い。単に強さ・弱さだけでなく、人と対戦して“面白い”かどうかなど、進歩の余地はまだまだあります」
  • はてなブックマークに追加
  • Yahoo!ブックマークに登録
あなたを求める企業がある!
まずはリクナビNEXTの「スカウト」でチャンスを掴もう!
スカウトに登録する
根村かやの(総研スタッフ)からのメッセージ 根村かやの(総研スタッフ)からのメッセージ
一大ブレイクスルーとなった「モンテカルロ法」による囲碁ソフトは、囲碁が強い人でなくても作れるのが従来との違いのひとつとか。「でも、知識ベースの方法がまったく無駄になったということではないと思います。将来は、両方のアプローチをうまく生かしたソフトが出てくるのではないでしょうか」と電通大の伊藤氏。そんなソフトが、人間と互角の勝負をする日が楽しみです。

このレポートを読んだあなたにオススメします

とりあえず旅行会話から!iPhoneアプリで外国語を解決だ

英語が苦手…ならば検証!音声翻訳システムの最前線

エンジニアに英語力、語学力が問われる時代になった。ただ、読み書きはある程度できても、会話やコミュニケーションを不得手とするエンジ…

英語が苦手…ならば検証!音声翻訳システムの最前線

ニコニコ動画「踊る初音ミク」で注目度急上昇の先端技術

AR(拡張現実)技術で近未来をつくるエンジニアたち

現実空間を拡張する技術、AR(Augmented Reality)。昨年ごろから世間で注目を集めるようになってきているAR。実際…

AR(拡張現実)技術で近未来をつくるエンジニアたち

超精密バイクから建設機械各種、1/1ノートPCまで作り倒した

迫真の紙芸術!エンジニアのペーパークラフトがすごい

カラープリンタが一般家庭にも普及したおかげで、Web上で配布できる手ごろなプロモーション・グッズとして、ペーパークラフトが深く静…

迫真の紙芸術!エンジニアのペーパークラフトがすごい

我ら“クレイジー☆エンジニア”主義!

コンピュータは羽生棋士に勝てるか?人工知能の松原仁

我ら“クレイジー☆エンジニア”主義!人工知能研究の第一人者として知られ、「ロボカップ」サッカー立ち上げ時のメンバーの一人、さらに「ゲーム情報学」という新領域を提唱し…

コンピュータは羽生棋士に勝てるか?人工知能の松原仁

我ら“クレイジー☆エンジニア”主義!

「光学迷彩」で透明人間を工学的に実現した稲見昌彦

我ら“クレイジー☆エンジニア”主義!常識に縛られない異才・奇才が未来技術を切り開く。常識破り、型破りの発想をもったクレージーエンジニアを紹介する第13回は…

「光学迷彩」で透明人間を工学的に実現した稲見昌彦

応募者は「イケた!」と思ったのに……なぜ不採用?

スキルが高い人材でも「NG」を出した人事の証言

求人の募集要項にあるスキルは満たしていたのに、なぜか結果は不採用。そんな経験をした人も多いのでは? では、採用に至らな…

スキルが高い人材でも「NG」を出した人事の証言

この記事どうだった?

あなたのメッセージがTech総研に載るかも

あなたの評価は?をクリック!(必須)

あなたのご意見お待ちしております

こちらもお答えください!(必須)

歳(半角数字)
(全角6文字まで)
  • RSS配信
  • twitter Tech総研公式アカウント
  • スカウト登録でオファーを待とう!
スマートグリッド、EV/HV、半導体、太陽電池、環境・エネルギー…電気・電子技術者向け特設サイト

PAGE TOP