7月末にマイクロソフトがOpen AIに1000億円超(10億米ドル)を出資すると発表した。Open AIは米国ナンバーワンのアクセラレーターであるYコンビネーターの元CEOで現Open AIのCEOを務める、34歳のサム・アルトマン、イーロン・マスクらが立ち上げたAIのラボである。元々非営利組織だったが、昨年イーロン・マスクがテスラにフォーカスするために辞職、サム・アルトマンが営利を追求する会社に変えた。人の脳ができることは何でもこなせる汎用AI「AGI(Artificial General Intelligence)」の構築を目指している。AGIの可能性については多くの専門家が懐疑的で、トップのサム・アルトマンですら実現できないかもしれないと認めている。それでも、「開発レースは始まっており、挑戦しなければならない」という。サム・アルトマンらしいコメントだ。


 そのOpen AIを顧客に持つシリコンバレーのScale AIが8月にユニコーン入りした。ピーター・ティールのFounders Fund、その他トップクラスのVCであるAccel、Index Venturesなどから1000億円超の企業価値で100億円超(1億米ドル)の資金を調達した。


 ちょうど1年程前に、ある日本の会社から、AIのエンジンを構築するための効率的なデータのタグ付け技術を探しており、Scale AIを訪問したい、という連絡を受けた。AIエンジンを大量のクリーンなデータで訓練する必要があり、そのタグ付けを人がやるのでなく、ソフトウエアを使って効率的に行いたい、という要望である。作業としては例えば、コンピュータの画面に写真を映し出し、マウスを使ってオブジェクトを選択して、建物、人、店と区別していくといったものになる。当時は2年前に創業したばかりの、そこまで大きくない同社のサンフランシスコにある本社を3人で訪問し、事業の説明を受けた。


 AIのアプリケーション開発が、これまでのソフトウエア開発からファンダメンタルなシフトを引き起こした。多くの場合、AIシステムのパフォーマンスはアルゴリズムでなく、データに依存する。タグ付けされたデータがなければ、モデルは作れない。同様にモデルを適応、改善させるためにも、コーディング以上に、さらなるデータが必要となる。大量の訓練データを収集することと、訓練データの質を高めること(タグ付けされたデータセットを用意すること)が重要となる。Scale AIは大量のデータのタグ付けプロセスの向上と高品質なデータセットの提供に取り組んでいる。大量の高品質なデータにより、安全で正確、かつバイアスのないAIシステムを構築できるようにするというわけだ。


 Scale AIのソリューションはソフトウエアと人を組み合わせたソリューションとなっている。利用者は、最初にAPI(Application Programming Interface)を通して、生のデータ(テキスト、静止画、動画など)をScale AIに送る。Scale AIでは、受け取ったデータをソフトウエアを使って自動でタグ付けし、その後、社員にデータを渡してチェック、完成させる。これまで数時間かかっていたタグ付けの作業が数分で完了するという。同社によるとタグ付けの正確さは95%以上とのこと。利用者はScale AIによってタグ付けされたデータを受け取り、AIのモデルを構築する。


 例えば自動運転のソフトウエアを開発する会社では、自動車を走らせて得られる画像のタグ付けに人を雇う必要があり、毎年数億円がかかってしまう。大企業であれば、それを自社内でやることも可能かもしれないが、Scale AIはこの厄介で退屈な作業を効率化し、様々な規模の会社がAIの訓練のためのデータを準備できるようにして、AIのアプリケーションの開発を加速させたいとの考えを持つ。前述のOpen AIの他、トヨタ・リサーチ・インスティチュート、Uber Technologies、Lyft、AlphabetのWaymo、General MotorsのCruiseといった自動運転関係の企業、Pinterest、Airbnbなどが同社のサービスを利用している。AIを開発しようとしている全企業がScale AIの顧客対象となる。


本記事は、日経BP総研とSansan株式会社が共同で企画・制作した記事です。
© 2019 Nikkei Business Publications, Inc. / Sansan, Inc.