• はてなブックマークに追加
  • Yahoo!ブックマークに登録
人のつながりを分析し、「心地よさ」を実証する
ミクシィの“ソーシャルグラフ”データ解析技術とは
ソーシャル・ネットワーキング・サービス(SNS)では、ソーシャルグラフと呼ばれる人と人との“つながり”の情報が活用されている。「mixi」では、日々どのような方法でこのソーシャルグラフを分析しているのか。その最前線で活躍する木村俊也氏の話を聞いた。
(取材・文/広重隆樹 総研スタッフ/宮みゆき 撮影/栗原克己)作成日:11.09.14
ソーシャルグラフを分析しその知見を社会に還元する
木村 俊也氏
株式会社ミクシィ システム本部 技術部
研究開発グループ リーダー
木村 俊也氏
木村 俊也氏
【図1】What is Social Graph?

 8月に都内で開かれた「Japan Innovation Leaders Summit(JILS)」。そのテクノロジー・セッションでひときわ注目を集めたのは、ミクシィの木村俊也氏の講演だった。テーマは「ソーシャルグラフのデータ解析」。ソーシャル・ネットワーキング・サービス(SNS)が全世界的に隆盛の今、利用者が友人や知人をを探したり、つながったりする時に役立つソーシャルグラフ。その分析はSNSにおける既存のサービスの向上や、新サービスの設計に活かされる。また、サービス提供企業が広告展開などを通してそこから収益を上げていくマネタイジングにも直結する技術である。それだけに、「会員2000万人以上の日本最大のSNS=「mixi」は、どのような手法でソーシャルグラフを分析しているのか」というところに聴衆の関心が集まったのだ。→講演レポートを読む

「『mixi』は、全ての人に心地よいつながりを提供し、誰もが主役になれる世界を創造することを、事業のミッションとしています。しかし、この心地よさというのは、一体何なのか。定性的には言えても、これを定量的に捉えるのは非常に難しい。『mixi』の中を流れるトラフィックや、そこで交わされるコミュニケーションの成り立ち、コミュニティが生まれる構造などを解き明かすことで、“心地よさ”を定量的、数値的に証明することができるんじゃないか。ソーシャルグラフを分析し、その知見を社会に還元するのが、私たちソーシャルグラフ・プロバイダーの責務だと思うんです」
 と、木村氏はソーシャルグラフ分析の意義を語る。

 ソーシャルグラフの術語では、SNSの有効会員はノード、そのつながりはエッジと呼ばれる。「mixi」ではノード数が2000万以上、エッジは数億のオーダーに上る。それが日々成長変化する様子をビジュアライズすると、その絵は、円錐状にたくさんの花をつけた未知の植物が咲き誇る姿にも似ている。独自の生態系を持つミクロコスモスのアート的表現とも言えるものだ。(図1)

 むろん、このソーシャルグラフの基本は1対1のコミュニケーションだ。「mixi」の日記に「私は今、走っている」と書けば、マイミクの一人が「イイネ」と答える。そのやりとりがコミュニティの中を伝播して、次第に複雑なネットワークを形成する。現実社会とのアナロジーで言えば、コミュニケーションの経路は一つの「道」であり、そこに流れるトラフィックは「交通」であり、ネットワークが集中するクラスターは一つの「町」である。
 一つ一つの道の交通を計測し、町の構造を整理して示すことがソーシャルグラフ分析の基本技術ということになる。

流行をつくる側に立ちたい

 これまでの「mixi」におけるソーシャルグラフ分析は、メンバーごとのプロフィールやリンクをリレーショナル・データベースに蓄え、これをダンプし、非正規化した上でKVS(Key-Value Store)に落とし、それを高速に回してデータを生成するというのが一般的だった。

 しかし、ホップ数を増やしてリンク先の細かい属性を分析しようとすると、いろいろなグラフを解析しなければならず、DBの数も無制限に増え、解析スピード、スケーラビリティの点でも問題が生じるようになる。そこで近年の「mixi」研究開発Gで注目しているのが、グラフ専用データベースのGraphDBである。

 JILSの講演では、このGraphDBを用いる意義と、その新しいインプリメンテーションの一つである、Neo4jの活用が主題となった。特にNeo4jの優れたアベイラビリティとスケーラビリティ、豊富な機能、高速処理については強調されたところである。実例として、スタンフォード大学に用意されているデータセットをNeo4jに格納して、「R」などを用いてビジュアル化するプレゼンテーションも行われた。

「Centrality(中心性)」「クラスター係数」といった複雑ネットワーク系の数学モデルにおける専門用語が頻出する講演は、筆者にも十全に理解できたとは言えないが、刺激あふれるものであったことは確かだ。とはいえ、最近のSNS系企業の技術セミナーで大規模データ処理技術がテーマになると、よく聞くのが、Hadoop、MongoDB、Tokyo Cabinetといった新しいツール類の活用事例だ。そうした最新のテクノロジー志向のムーブメントのなかで、あえて水面下に注目を集めているGraphDBを持ち出したことが、講演のミソでもあった。
「ここでGraphDBを紹介したので、おっと思われた人も多かったのではないでしょうか。最近Hadoopなどの高性能で汎用的なDBやフレームワークが出てきて、多くの分野で活用されています。しかし、ドメインに適した最適のアーキテクチャやツールがあるはずだし、それを見つけ出して活用することの面白さを訴えたかったんです」

 もとより、木村氏自身がHadoopを敬遠しているわけではない。日頃からデータ処理に活用しているし、ミクシィ社内の技術者にも最新技術志向の強い人は多い。ただ、エンジニアには常によりよいアーキテクチャを模索する必要性があることを示したことに、今回のプレゼンテーションの意味があった。

「流行をキャッチアップし、さらに別の道を模索することにエンジニアの楽しみがあると思います。僕らは流行をキャッチアップするだけでなく、常に流行をつくっていけるチームになっていきたいという思いは強いですね」
 その取り組みの姿勢に、木村氏の一種のスタイル、ひいてはミクシィ・エンジニアのこだわりを感じたりするのである。

大規模なデータをベースにしたコミュニケーション研究

「mixi」のソーシャルグラフ分析から見えてきたことがある。
「年齢、年代によって『mixi』の使い方が違う。それがグラフの形の違いにも表れてきます。高校生はつながりをすごく求めている人が多い。とにかく友達を増やしたい。大学生ともなると、友達を選びながら、コミュニケーションするようになる。社会人では、その限定度がさらに強くなります。『mixi』はほかのSNSに比べてリアルライフの友達関係がネットワークにも強く表れます。年齢や社会体験が深まるとともに、友人の選び方が変わってくるという社会的事実が、ネットにも反映されていると言えると思います」

 ただそれだけなら、従来の社会科学、社会心理学やコミュニケーション論の知見でも十分説明ができることだ。
「僕らも社会科学の知見を無視するつもりはありません。ただ、社会科学が対象にしているデータと、僕らが対象とするソーシャルグラフのデータは量的にケタが違う。これだけ大規模なデータベースを用いて、人々の属性ごとのコミュニケーションを分析した研究というのはまだあまりないと思います。『mixi』のデータをそのまま外部に提供するわけにはいかないけれど、僕らが得た知見を何らかの形で、社会科学系の研究にも活かすことができるといいなと思います」
 詳細は明らかにされなかったが、ソーシャルグラフ分析に関して、すでに社会科学系研究者と木村氏らの共同研究は始まっているという。

ミクシィだからこそできるデータマイニングの実証研究

 日々生成・変化するソーシャルグラフの膨大な生データを前に、さまざまな方向からその特性を分析する。これは一般には、データマイニング技術と呼ばれる領域だ。アプリケーション開発ほどの華やかさはそこにはない。データが膨大であればあるほど、アーキテクチャの設計が重要になり、そこがうまくいかないと、解析そのものが不可能になるリスクもある。

「できるはずだと思ったことが、できない。なぜできないのか。頭を壁にぶつけるような、苦闘の連続だ」と、木村氏も言う。
たとえデータが分析できても、それが研究にとって、あるいは事業にとって、どう役立つのかはすぐにわからないこともある。地味でニッチで、息の長い研究分野であることはたしかだ。

 とはいえ、データマイニングを「今まで知られていなかったが、役立つ可能性があり、かつ、自明でない情報をデータから抽出すること」あるいは「データの巨大集合やデータベースから有用な情報を抽出する技術体系」と定義づければ、そこにエンジニアがのめり込む要素は十分にある。ミクシィで、木村氏と共にデータマイニングを担当するエンジニアは、「ミクシィだからこそ、それができる、それをやりたい」と勢い込んで入社してきた人ばかりだという。

「顧客データを活用してサービスをよくしよう、売り上げを高めようというのは、昔からどんなビジネスにもある動機です。ITの世界でも、ERPソフトや会計管理システムなどがデータマイニングの知識を活用してきたし、最近で言えば、WebのログデータからWebマーケティングへの展開ということは、どの企業も考えるようになっています。いわば、データマイニングの需要がこれほど明確になっている時代はない。ただ、落とし穴もあります。もし、Webログ解析が売り上げ向上にダイレクトに貢献するということが実証されないと、一種のブームに終わって、後は急速に需要が萎んでしまうということにもなりかねない。僕らのソーシャルグラフ分析も、常にそうしたリスクと隣り合わせなのです」

 SNSがネット世界の人々に、「心地よい関係性」をもたらし、それがビジネスとしても成功するために、データマイニングによるソーシャルグラフ分析が重要であることはわかった。後は、それを実証できるかどうか。まさに今は、その岐路に立っているのだ。

技術の最前線は、人の感性領域にまで分け入る

「mixi」であれ、「Twitter」であれ、「Facebook」であれ、いまやそれにアクセスしないと一日が明けないほど、不可欠のコミュニケーションツールとなっている人は増えている。「mixi」でないと連絡できない友人が、筆者にも存在する。SNSはこれからも進化し、多様なサービスがあふれ、そしてふと気づくと、かつての電話と同様に、現代人のコミュニケーション基盤となっていることだろう。

 もちろんSNSが多様化すればするほど、ユーザーは選択をするようになる。なぜ自分は他のサービスではなく、このサービスを使い続けるのか。今はその理由が単に「それが流行っているから」なのかもしれないが、いずれSNSが成熟化するにつれて、「自分にはこのサービスが合っているから」というテイストの相性が重要になってくるはずだ。便利で心地よいと人が思うのは、それがその人のテイスト、つまり感性に合致するからだ。

 かくして、ソーシャルグラフ分析技術は、人間の感性や官能の領域にまで分け入ることになる。
「これが受け入れられそうだと直感だけでサービスを付け加えたら、それが当たったということは実際あると思います。ただ、直感だけだと永続性がないとも思う。僕らは、成功するサービスの理由を、やはり数値的に示したい。それができる力が、僕らエンジニアにはあると思っているんです」
 木村氏は、ソーシャルグラフ分析の新しい課題をこのように語るのだった。

株式会社ミクシィ システム本部 技術部 研究開発グループ リーダー 木村 俊也氏

2007年ミクシィ入社。レコメンデーションや広告ターゲティングなど、大規模テキストやリンクデータを分析し、サービスへの応用に従事。また、大規模データ解析に関する雑誌の執筆や、アカデミックな情報系学会での委員としての活動をしている。

  • はてなブックマークに追加
  • Yahoo!ブックマークに登録
あなたを求める企業がある!
まずはリクナビNEXTの「スカウト」でチャンスを掴もう!
スカウトに登録する

このレポートの連載バックナンバー

人気企業の採用実態

あの人気企業はいま、どんな採用活動を行っているのか。大量採用?厳選採用?社長の狙い、社員の思いは?Tech総研が独自に取材、気になる実態を徹底レポート。

人気企業の採用実態

このレポートを読んだあなたにオススメします

立ちはだかる壁。それを自ら乗り越えるために彼らがしたこと

ミクシィ入社3年目――若手エンジニアの成長力を探る

人気企業の採用実態若手エンジニアが成長する環境とはどのようなものか。エンジニアの成長にとって、開発現場の習慣や風土は大きく作用する。2009年新卒…

ミクシィ入社3年目――若手エンジニアの成長力を探る

ソーシャルネット時代に「mixi」が目指す姿とは?

ミクシィ原田副社長が明かすリアル・ソーシャル戦略

人気企業の採用実態「mixi」はソーシャルメディアとして、今後どのような位置付けを目指すのか。他のソーシャルメディアとは、どう差別化していくのか。…

ミクシィ原田副社長が明かすリアル・ソーシャル戦略

エンジニア目線の勉強会、自社の開放、学習する組織づくり…

ミクシィが取り組むエンジニアを育てる文化・組織とは

人気企業の採用実態自身のスキル向上のために、日々の学習が欠かせないエンジニアたち。プロジェクトの渦に揉まれて経験を積むのも一つの方法だが、勉強会や…

ミクシィが取り組むエンジニアを育てる文化・組織とは

ソーシャル時代を見据えた様々な仕掛けと舞台裏

ミクシィとバスキュール「mixi Xmas」開発3年間の軌跡

人気企業の採用実態「mixi」上で、クリスマスシーズンに実施しているソーシャル・キャンペーン企画「mixi Xmas」。この大規模なイベ…

ミクシィとバスキュール「mixi Xmas」開発3年間の軌跡

未踏スーパークリエータ衣川氏の“Objective-C特別授業”を再現

3カ月でリリースした「mixi for iPad」開発舞台裏とは

人気企業の採用実態10月にミクシィが提供を開始した「mixi」のiPad向けアプリケーション「mixi for iPad」。未踏スーパークリエータ…

3カ月でリリースした「mixi for iPad」開発舞台裏とは

こんな時代に人事が欲しがる

年収1000万円超プレイヤーの自己投資術

不景気だから年収が下がるのは当たり前、と思ってはいませんか? 世の中には、こんな時代でも年収が上がり続ける「不況知らず…

年収1000万円超プレイヤーの自己投資術

この記事どうだった?

あなたのメッセージがTech総研に載るかも

あなたの評価は?をクリック!(必須)

あなたのご意見お待ちしております

こちらもお答えください!(必須)

歳(半角数字)
(全角6文字まで)
  • RSS配信
  • twitter Tech総研公式アカウント
  • スカウト登録でオファーを待とう!
スマートグリッド、EV/HV、半導体、太陽電池、環境・エネルギー…電気・電子技術者向け特設サイト

PAGE TOP