ホーム > NSSOLテック・コラム > データ分析 > 「優れた予測を素早く誰でも」機械学習を自動化するDataRobot。新しいテクノロジーで新しいビジネスを切り開く

NSSOLテック・コラム

データ分析

2016/09/12

「優れた予測を素早く誰でも」機械学習を自動化するDataRobot。新しいテクノロジーで新しいビジネスを切り開く

NSSOLは2016年7月に、国内システムインテグレータとして初めて、機械学習プラットフォーム「DataRobot」の提供を開始したことを発表しました。データサイエンティストが絶賛するDataRobotですが、どこが優れていて、どんなことができるのか。NSSOLがDataRobotで狙うものはなにか。ソリューション企画・コンサルティングセンター 三橋利也さんに伺いました。

「DataRobot」は機械学習を自動化してくれるということですが、どういうことでしょうか。詳しく教えてください。

機械学習とはコンピュータが過去のデータの特徴を自分で抽出して、そのパターンを学習して未来を予測する技術です。
例えば、ある化粧品会社で新商品のダイレクトメールを送ったら、買ってくれそうなお客様を探したいというニーズがあったとします。そうした場合に、機械学習を使って、過去にダイレクトメールを送った時の開封率や返答率、年齢だとか購買頻度、購入した商品やその価格帯等のデータをコンピュータに学習させると、コンピュータが自動的にその特徴をモデル化し、ダイレクトメールに反応して、新商品を買ってくれそうなお客様をリストアップする、といった使い方ができます。

なるほど。では、機械学習を「自動化」するとはどういうことですか?

通常、機械学習は、データサイエンティストと言われる人たちが、コンピュータが理解しやすいようにデータを整理します。そして、専門のソフトウェアを使ってアルゴリズムを自分でプログラムして、データを読み込ませます。予測の精度がうまくでていないと思ったら、データの加工方法やアルゴリズムのパラメータ、アルゴリズムそのものを変えてまた試してみる。アルゴリズムは代表的なものでも10種類以上ありますので、何回も試行錯誤が必要ですし、精度の高い予測モデルをつくるのに数カ月かかる場合もあります。
それがDataRobotでは、データを読み込ませてボタンを1つポーンと押すだけで、すぐに複数の予測モデルがつくれて、しかも精度の高い順番で提示してくれますので、ユーザーはその中から精度の高いモデルを選べばいいだけです。

画期的!DataRobotはなぜそのようなことができるのでしょうか?

DataRobotには有望なアルゴリズムが100種類以上ビルトインされています。DataRobotがデータを読み込むと、このアルゴリズムが自動で走り、複数の予測モデルを同時並行で全部学習するという仕組みになっています。
いかに優秀なデータサイエンティストでも好きなアルゴリズム、あるいは得意なアルゴリズム・苦手なアルゴリズムがあるので、どうしても偏りがでてしまいます。また従来のソフトウェアだと、アルゴリズムを決めたあとも更に細かなパラメータのチューニングが必要だったりしますので、ひとつのアルゴリズムを使いこなすだけでも手間と時間がかかってしまいます。
でもDataRobotはビルトインされているアルゴリズムを全種類自動で試してくれるので偏りがありません。もちろんアルゴリズムのチューニングも全てDataRobotがしてくれます。

DataRobotのような製品はこれまでになかった?

似たような製品はあります。ただ、データサイエンティストの方々からは、ここまでアルゴリズムの種類が多くてなおかつ自動化が進んでいて、芸が細かく、かゆいところに手が届くような機能がふんだんに備わっている製品はないという評価をいただいています。中には「こういう製品を自分もつくりたかった。気付かなかった」という人までいました。

大絶賛ですね。

でも、データサイエンティスト以外の、あまりデータサイエンスに詳しくない方々からは「データを突っ込めば自動で結果を出してくれるのでしょ」という過度な期待を持たれることもあります。一方で、「何だかすごそうだけど、何がすごいのかよくわからない」と言われる場合もあります(笑)。

なるほど、データサイエンティストの仕事をよく知らないがために、DataRobotのすごさもわからないということですね?

そうですね、でもそれはそれでいいと思います。技術の進歩でこれからデータサイエンスは、特殊なアルゴリズムを必要とする部分はどんどん自動化が進んでいき、人がやらない領域になってくると思います。めんどうなところはDataRobotのようなソフトウェアに任せ、誰でもデータ分析を手軽にできるようになるのです。そうなればソフトウェアのどこが優れているかなど意識する必要もないと思います。これは、DataRobotを開発したDataRobot,Inc(以下DataRobot社)の「優れた予測を素早く誰でも」という理念にも表れています。

不足していると言われているデータサイエンティストの代わりをしてくれるかもしれませんね。

ええ。ただ、正確に言えば、DataRobotはまだ誰にでも使えこなせるとまでは言えないと思っています。確かにオペレーション自体はボタンひとつでできるのですが、結果の予測精度がよすぎるとか、反対に精度が全然出ないといった時に、やはり人がその原因を探らなければならない部分は残っています。

それでも、今後DataRobotがブラッシュアップされて、「優れた予測を素早く誰でも」できるようになったらデータサイエンティストはどうなるのですか?

鋭いご指摘です。先ほども話しましたが自動化は技術の進歩の方向としては必然の流れと思われるので、止めることはできないでしょう。だからといって、データサイエンティストという仕事はなくなる、ということにはならないと思います。データサイエンティストは予測モデルをつくることだけが仕事ではないんですね。本来は、どういう問題を解いたらいいのかといったような、お客様のビジネスにインパクトを与えることが最も重要な役割だと思うのです。手がかかるところはDataRobotで自動化して、データサイエンティストはもっと業務知識を蓄積していってDataRobotから出てきた結果をどう業務に適応したらいいのか、あるいは業務プロセスをどう改善したらいいのかというところに時間を使うべきだと思います。
また、DataRobotは素晴らしい優れた製品ですが、人があるドメインにどっぷりつかって半年だとか1年だとか、長い時間かけてつくったモデルにはかなわない部分もあります。あと、たった0.1%の精度がビジネス上、非常に重要だというような領域だったら人が手掛けた方がいいと思います。当社の関連会社の金融エンジニアリング(データ分析専門企業。以下 FEG)がやっているのはまさにそういう部分で、金融機関の与信のモデルでコンマ1%違うと、最終的な利益のインパクトが数億円になる。そういった領域は人の方がいいのかもしれません。それと、予測の精度よりもなぜ予測が当たったかがわかるわかりやすいモデルをつくってほしいというニーズに対しては、自動化は向かないと思います。

ではDataRobotが向いている領域は?

DataRobotは汎用性が高いと思いますが、例えばマーケティングの領域のように、なぜそうなるのか理屈はわからないけど、とにかく予測が当たればいいという領域や、モデルの数が多すぎて人手ではメンテしきれないような領域、試行錯誤が多い領域だったらDataRobotを使いたくなるのではないでしょうか。

ところで、DataRobot社とはどういう企業ですか?

2012年に設立された、社員が120名程の米国のベンチャー企業です。現在は、投資ラウンドのシリーズB で、約60億円を調達した急成長の企業です。DataRobot社の特徴はなんといっても、世界中の優秀なデータサイエンティストが凌ぎを削る世界最大のデータ分析コンペサイトKaggleで1位を獲った社員が数名いるという、まさにスーパーデータサイエンティスト集団だということでしょう。

スーパーデータサイエンティスト集団ですか!でもNSSOLがそんな米国のベンチャー企業と知りあうきっかけは何だったのでしょうか?

昨年、NSSOLとFEGのチームがKDDカップで2位を獲りましたが、実はその時DataRobot社が3位だったんですね。その表彰式の時に当社側のメンバーがDataRobot社のプレゼンを見て「すごい製品がある」と報告してくれたのが一つの流れです。
もうひとつの流れが、古くからNSSOLやFEGを知っている方がたまたまDataRobot社の日本法人にいらっしゃった。その方から販売代理店の打診がありました。KDDカップ2位の実力はもちろん、NSSOLにはデータウェアハウスなどで情報系の領域を長年手掛けてきた実績がありますし、データサイエンスの領域に強いFEGが関連会社にいるので、NSSOLが販売代理店に適任だろうということで声をかけていただきました。

2つの流れが同時期に重なったというところに運命を感じますね。ところでNSSOLがDataRobotビジネスでめざすところは?

DataRobotは、NSSOLがオープンイノベーションという切り口で何かビジネス展開できないかを考えていた、まさにその時に巡り合えた製品です。DataRobotのビジネスはNSSOLのオープンイノベーション第一弾として大切に育てていきたいと思っており、現在、DataRobotをお客様にご紹介するのと並行してサービスメニューなどを整えているところです。また、これを皮切りに、今後もデータサイエンスに限らず、さまざまな分野でオープンイノベーションを起こすべく、ベンチャー企業との関係を深め、優れた商材を見つけ出していきたいと思っています。そして、こうした新しいテクノロジーを使ってお客様と一緒に、まだ世の中にない新しいビジネスをつくっていけたらいいなと思っています。

楽しみにしています。ありがとうございました。

リンク

関連する記事