sansansansan
Created with Snap
Pocket HatenaBlog facebook Twitter Close

Features Business 公開日:2018.05.31

すべてのシステムを塗り替える破壊的テクノロジーとは──楽天・森正弥

日本有数のビッグデータ保有企業・楽天の技術研究トップが語るテクノロジーの最先端。

お気に入り
 テック業界では、様々な技術コンセプトが出現しては消えていく。そうしたコンセプトは時に「バズワード」と呼ばれ、ユーザーからもベンダーからも嘲笑の対象になることさえある。

 しかし、バズワードと言われた厳しい時を生き残り、自らを洗練させてビジネスの最前線を支えるようになったコンセプトも多い。クラウドコンピューティングは、メールアプリケーションのようなコミュニケーション領域だけでなく、基幹システムとして採用する企業も珍しくなくなった。情報爆発時代に「管理できず、保管しているだけ」だったデータを統合し、ビッグデータとして活用する企業も世界的に増加している。いま最もホットな人工知能(AI)の開発でも、それを支える機械学習と深層学習をビジネスに応用している例は枚挙に暇がない。

 日本有数のビッグデータを保有しているであろう企業、楽天で執行役員を務め、楽天技術研究所の代表も兼務する森正弥氏は、しかし、「データを持っていることが本当に強みになるのだろうか、という時代が来ているのかもしれません」と語る。

 森氏はバズワードではなくなったはずのビッグデータに幻滅したのだろうか。話を聞いてみると、森氏の考えはもっと先を行っていた。

 「ビッグデータがないなら、作ればいいんじゃないですか?」

 データを取り巻く環境が変わりつつある。そのドライバーになっているのは、データ領域と密接な関係を持つ深層学習・機械学習というAI関連技術だ。森氏は「ディープラーニングを中心とする技術群がすべてのシステムを塗り替えてしまうだろう、という大きな問題意識をもっています」とさえ述べており、インパクトの強さがうかがい知れる。

 両輪で進むビッグデータとディープラーニングの進化を森氏に聞いた。

「データの宝庫」をどう活用するか

 巨大ECサイト「楽天市場」から金融サービスの「楽天証券」まで、ポイントサービスの「楽天スーパーポイント」から結婚相手紹介サービスの「オーネット」まで、楽天はまさに「データの宝庫」のような会社だ。しかも、これから携帯電話事業に参入しようというのだから、さらにたくさんのデータがやってくることになる。

 これらの中で、楽天市場にたまったデータを様々な角度から分析することで、これまで見えてこなかったニーズを顕在化させてきたという。

 「最初から『この商品を買うぞ』と決めて、楽天市場にダイレクトにアクセスしてきて購入し、去っていく。そんなお客様も、もちろんいるんです。ただ、多数はそうではなくて、自分が何を欲しいのかも分からない時から情報を収集し、自分はこういう物が欲しかったんだと理解・学習して、それで商品を買うんです。この過程で購入を諦める人も出てきますよね。ですから、売れている商品の分析だけでなくユーザーの関心を追っていくのが、とても大切なんです。例えばそれは『とてもよく読まれている広告』と『売れている商品のページ』との間にギャップとして現れてきたりするんです」

 「たくさんのニーズがある商品にフォーカスして、そこの販売に注力するというのは、ロングテールの時代には限界があります。テールのほうが大きいのですから。ですから、個別のニーズを抽出するために様々なソリューションを導入しています。特定のお客様のニーズに合うようにページを高速でチューニングしていく仕組みを入れて、お客様のニーズを顕在化させていくのですね。このようなデータの分析と、その先の施策考案、そして実行は、総力戦ともいえる様相を呈しています」

 と、ここまではデジタルマーケティングやデータ分析を仕事にしている人であれば、「そうだろうね」と納得してもらえる話であろう。しかし、筆者が「たくさんのデータを持っているからこそできるのでしょうね」と述べると、森氏は「これからビッグデータを持っていることが強みではなくなる時代がくるかもしれませんよ」と答えた。

GANの衝撃

 「データ分野では今、まったく新しいトレンドが生まれています」

 その新しいトレンドというのが「GAN」だ。「Generative Adversarial Network」の略で、「敵対的生成ネットワーク」と訳される。

 「GANはディープラーニングで利用できるアルゴリズムで、いわば『データを増やす手法』と言えます。データが少ない場合、GANを用いてデータを激増させることができるのですね。そうして得たデータを機械に学習させるのです」

 GANの初歩的な応用例として森氏が挙げたのは、イメージや音声のデータ生成だ。

 「現在のGANは、静止画などの画像系を中心に活用されています。例えば手書きの文字を認識させたい場合、何百万もの手書きの字を集める必要がありますが、それってとても難しいですよね。そういう時にGANを使って、ごく少数のサンプルからデータを増やしていくのです。顔認識でも、これまでは正面から撮った1枚の画像だけでは認識できないので、『何枚か撮らせてください』などと言って正面、右向き、左向きと何枚か撮影したものです。でも、今は1枚でいいんです。横顔などはGANがデータを生成しますから」
「音声も同様です。これまでは『認証用の基礎データを取るので、まずは40秒ほど喋ってください』と。それが今は一言つぶやくだけで、あとはGANでデータを生成してくれます」

 こうしたデータ生成の新たな手法は、隣接するテクノロジー領域と歩調を合わせるようにして生まれ、今後さらに進化しようとしている。その最たる領域が深層学習・機械学習の分野だ。「画像データを認識して新規にデータを生成する」のだから、画像ではないデータを「画像」として「認識」させ、学習させることも可能だろう。実際、そうした観点から面白い取り組みが広がっているという。

 「データを画像と見なして認識・学習させるのは、これは別のトレンドとして存在します。以前とても面白い論文を読んだんです。それは量子力学の波動関数の計算過程とその結果を配置して、それを画像とみなしてディープラーニングに学習させるという内容でした。画像のデータ分析と量子物理学の計算はまったく異なるものですが、画像認識の手法を応用できたのです」

 「データを2次元状に配置できれば、人間の目で見れば計算式ですけれど、機械には『画像』として認識させられます。2次元状に配置したり、立方体状に配置したりと、様々なアプローチがあるのですが、そうするとニューラルネットワークの様々なモデルを適用できるようになるので、GANの対象にもなります。現在は主に画像関連のアプリケーションがたくさん出ていますが、今後は非イメージ分野での応用が広まっていくと思います。そうなれば、学習用のデータが用意できないから先に進めない、というケースが激減するはずです」

大企業とスタートアップ企業の関係が変わる?

 大企業だけがビッグデータを持っているという時代は、終わりを告げようとしている。以前から言われてきたことだが、結局は「データを使ってどんな価値を生み出すか」が重要なのだ。スタートアップ企業が、データを使って大企業が追いつけない早さでビジネスを拡大していくこともあるだろう。

 実際、大企業とスタートアップは、大企業がビッグデータを提供し、スタートアップがアイデアとテクノロジーを提供することで、提携関係を結ぶことが多かった。森氏はこうまで述べている。

 「今後はデータも大企業も、スタートアップには必要とされなくなるかもしれません。もっと様々な資源を提供しなければ、イノベーションのエコシステムから大企業が除外されていくのではないかとさえ思えます。だからこそ私たちは常に、何をスタートアップに提供できるだろうか、と考えなければいけません。そうしないと生き残れないんです」

 森氏がこれほどまでに危機感を募らせているのは、イノベーションの源泉が移行しつつあるからだ。つまり、本特集のテーマ「デジタルテクノロジーが変える競争の原理」がまさに起こりつつあると考えているのだろう。

 冒頭で「ディープラーニングを中心とする技術群がすべてのシステムを塗り替えてしまうだろう、という大きな問題意識をもっています」という森氏の発言を紹介した。他方で森氏は「ディープラーニングは急速にコモディティ化していて、誰でも使えるようになってきています」と述べている。

ビッグデータは作ればいい、さらに、AI関連のテクノロジーはコモディティ化しつつある──。であれば、「イノベーションの源泉」がどこに移ろうとしているのか。その考えは、第2回で紹介したい。


冨田 秀継
(撮影:淺田 創)


本記事は、日経BP総研とSansan株式会社が共同で企画・制作した記事です。
© 2019 Nikkei Business Publications, Inc. / Sansan, Inc.

関連記事

DIGITALIST会員が
できること

  • 会員限定記事が全て読める
  • 厳選情報をメルマガで確認
  • 同業他社のニュースを閲覧
    ※本機能は、一部ご利用いただけない会員様がいます。

公開終了のお知らせ

2024年1月24日以降に
ウェブサイトの公開を終了いたします