ホーム > NSSOLテック・コラム > データ分析 > データを通して「人」を知る ~今、注目の「データ分析」とは~

NSSOLテック・コラム

データ分析

2016/01/19

データを通して「人」を知る ~今、注目の「データ分析」とは~

昨今、大きな注目を集めている「データ分析(データサイエンス)」。ビジネスでの需要が高まりつつあることを受け、2017年度には滋賀大学がデータサイエンス学部を設置するなど、教育機関もデータサイエンティストの育成に力を注ぎ始めています。

その先駆けとして昨年(2015年)11月、NSSOLグループの株式会社金融エンジニアリング・グループ(FEG)の創業者・中林三平さんが、電気通信大学にてデータ分析の講座を担当しました。同講座には当初の予想を遥かに上回る受講者が集い、「データ分析に対する関心の高さ」がうかがえる盛況ぶりでした。

1989年に同社を設立した中林さんは、チーフ・データサイエンティストとして、主に金融機関をターゲットにしたモデル構築・運用やソフトウェア開発などで多くの実績を収められています。
今回は中林さんに貴重なお時間をいただき、データ分析が注目を集める理由や技術が持つ可能性、さらに「人の行動を読み解くため」にデータ分析を始めたというご自身の思いなど、たくさんのお話を伺いました。

なぜ今「データ分析」が注目を集めているのか?

先日の電気通信大学の講義は、予想をはるかに超えた受講者数だったそうですね?

はい。当初は20名ほどの学生さんを想定していたのですが、実際には社会人を含め、65名もの方々が受講してくださいました。「データアントレプレナー育成講座」と題した全9回の連続講義で、私は第1回目の講師にお招きいただいたんです。初回でしたので、データサイエンスの世界全体を見通せるような講義を意識したつもりです。
盛況ぶりに驚くとともに、この分野への注目度の高さを感じています。

なぜ、それほどまでにデータ分析が注目を集めているのだと思いますか?

ITの進歩に伴ってデータの重要性が浸透し、各業界にデータを蓄積する文化が根付きました。しかしそれが莫大な量になったことを受け、データを有効活用する術として「分析」の大切さが浮き彫りになったのでしょう。ただ、実際にデータ分析に取り組んでみると、データサイエンティストが圧倒的に不足していることが分かり、人材の育成に力を入れるようになったのだと思います。最近「ビッグデータ」に興味を持つシステムエンジニアが増えたのも、そういった背景があるからでしょう。

データサイエンティストとはどのような仕事なのですか?

ビジネスなどの中から生まれてくる課題を、データをもとに数理モデルを作り、実際の業務に活かす仕組みを作っていくのがデータサイエンティストの役割です。例えば、あるタイプの人が30%いたとします。それだけではただの「情報」ですが、その人たちが将来どんな行動を取るかを予測できれば、ビジネスの新しい展開を考えることができますよね。

データ分析を始めたのは、「人間の行動原理を知りたかったから」

中林さんがデータ分析に興味を抱いたきっかけを教えてください。

背景にあったのは、「人間はどうしてこんな行動を取るんだろう」という疑問です。そこから「人間の行動は数理モデル化することができるか」という考えが生まれ、高校生のころからずっと頭をひねっていました。
人間の行動を数理モデル化すれば、ビジネスにも応用できるのは当たり前ですね。例えば、同じような条件の2人が住宅ローンを借りたときに、片方は順調に返し、もう1人は貸し倒れてしまうことがあります。データをもとに数理モデルを作れば、その違いを見極めることができるのではないかと考えたんです。それから現在に至るまで、ずっとデータ分析に夢中ですね。

高校生のころからデータ分析をされていたのですか?

はい。しかし今のようにコンピューターが身近にある時代ではありませんから、少ないデータをどうにか集め、電卓もない時代だったので手回し計算機で一生懸命分析していました。そんなアナログな手法なので、100件もデータがあると多すぎてどう扱っていいか分からないような状態でした。今とは大違いですね(笑)。
前職の野村総研に入った頃にはずいぶんと計算環境も良くなっていました。昭和の終わりごろには、現在のデータ分析のコアの技術となる「人工知能」も世間の注目を集めるようになり、そのころには私も十分に実務経験を積んでいましたので、1989年に独立して「金融エンジニアリング・グループ(FEG)」を立ち上げました。

もともと、金融機関をご専門にするつもりで設立されたのでしょうか。

お客様の大半は金融機関ですが、それが専門というわけではないんです。実際には「数理モデルで人間の行動を表す」という社是のもと、あらゆる業界のデータ分析やモデリングを行っています。
ただ、金融系を多く手がけているのには理由があります。データ分析を正確に行うためには、「大量のデータ」が欠かせません。そして金融機関には入金・出金などの莫大なデータが保有されています。そこで金融機関に的を絞り、データ分析の基盤を築いたというわけです。

FEGがこれまで携わったデータ分析事例についてお聞かせください。

代表的なのは、住宅ローンの審査モデルです。20年ほど前までは、住宅ローンを貸すかどうかを人間が「YES」「NO」の2択で判断していました。ところがある銀行の頭取が、「金利を余分に積んでもらえれば貸せる」という判断の必要性を訴えたのです。しかしその判断基準は非常に難しく、人間をトレーニングして対応できるものではありません。例えば年間2%で貸し倒れる可能性がある人に、それ以下の金利で貸してはビジネスが成り立たないのです。
そこで私たちは10万件を超えるデータを分析し、貸し倒れの確率を推計する「審査モデル」を作りました

データ分析の成果は身近なところでも生かされているのですね。

そうですね。より身近な事例としては、ネットオークションの「詐欺検知システム」もあります。あるネットオークションでは出品者、購入者ともに詐欺が横行し、運営会社は手を焼いていました。不審な人を1000人まで絞り込んでも、全員をマークするには余計な労力がかかります。
このような課題に対し、私たちは、「本当に危ない人」を絞り込むシステムを開発しました。「こういう行動を示す人は詐欺を行う可能性が何%」というように、詐欺確率を推定できるモデルを作ったのです。

これからの時代に求められるのは、未来を見据えたデータ分析

中林さんが考える、データ分析の醍醐味を教えてください。

困り果てているお客様に、明確な答えを差し出すのは最高の快感です(笑)

最近も「社内事故がどうしても減らない」という運送会社さんのデータ分析をしていたところ、面白いことが分かりました。やはり毎日運転しているドライバーは乗っている時間が長い分、事故件数は多いです。しかし「乗車回数あたりの事故件数」という見方をすると、週1~2回しか乗らない人の方が10倍以上も事故率が高いことが分かりました。これを運送会社の方にお伝えすると、繁忙期はドライバー不足のため、事務職の人もトラックに乗っていることが原因ではないかと解釈できたんです。長年データ分析に携わっていても、こういう発見は本当に面白いですね。

もう1つは、社外コンペです。中でも「Kaggle(カグル)」というデータ分析の世界的なコンペは、私たちデータサイエンティストにとって非常に特別なものです。FEGのメンバーの約半数かなりの人たちも参加しており、誰かがランキングに入ると「あいつがあんなところにいるぞ」と社内で話題になるんです(笑)そして反則にならない程度に情報交換をしたりと、「Kaggle」を通じて社内が結束しているのを感じます。みんなで「Kaggleのトップ」という1つの目標をめざして競い合うのは、非常に楽しいですね。

データサイエンティストに求められる素養は何だと思いますか?

一言で表すなら、「しつこいこと」です。いい意味で「しつこさ」を極めたメンバーがいるんですが、彼の技術は本当に見事なものです。どんなに見付けにくい要素でも抽出してしまうので、社内では伝説の存在になっています(笑)データをよく見て、しつこく分析し続けるからこそ為せる業でしょうね。
あとは、「新しいもの好き」というのも重要なポイントです。画期的なモデリング手法が登場することがあるんですが、アンテナをしっかり張っていないとこういった情報はなかなか得られません。「新しいもの好き」な人はこういう情報を一生懸命探し、会社の中で広めてくれています。

データ分析の世界は今後、どのように変わっていくと思いますか?

今後のデータ分析において求められるのは、「予測」の力だと思います。巷では単なる「集計」をデータ分析と呼ぶ人たちもいますが、それは時間とツールさえあればできることです。それに「集計」はあくまでも過去のデータを束ねたものであり、将来の「予測」ではありません。

最近の通販サイトでは、「あなたにおすすめの商品」が表示されますよね。あれは「リコメンデーション」と呼ばれるもので、過去の購入履歴を「集計」して関連商品をピックアップしているんです。しかし、この手法では初めてサイトを訪れた人には何も薦められませんし、真新しい商品が登場したときに、誰にその商品を薦めればいいのかも分かりません
こういった問題を解決するためには、「予測」の力が不可欠です。例えば「新商品は既存のどんな商品と共通点があるか」など、「集計」とはまったく異なった手法が求められます。

もう1つは、「処方箋を書く」力です。ビジネスの世界では「予測」した結果をもとに、「会社が将来何をすればいいか」を設定しなくてはいけません。「ビジネス力」を問われる部分ではありますが、ここまでできるデータサイエンティストはかなり重宝されるでしょうね。
ただ注意したいのは、「知っている」と「できる」は別物だということです。どれだけ本を読んで知識を蓄えても、実際に分析ができなければ意味がありません。データサイエンティストをめざす方には少なくとも「予測モデルを作る」という意識を持ち、実地で生かせる分析力を身につけていただきたいです。

最後に、データサイエンティストとしての今後の展望をお聞かせください。

やはりこれからは、若手の教育に力を入れていきたいと思っています。優秀なデータサイエンティストを育て上げ、チーフとしての責任を全うしたいと考えています。
そして個人的な夢は、「Kaggle Master」になることです。「Kaggle」ではコンペごとの順位に応じて点数が付与され、点数の累積によって総合順位が変動します。そして、特に優秀な成績を収めた人には「Kaggle Master」という特別な称号が与えられるんです。すでにいくつかの条件は達成しましたが、「上位10%位に1回は入る」という最後の難関がなかなかクリアできません。長年データ分析に携わってきた身としては、何としても手に入れたい称号ですね。いつかは世界が認めるデータサイエンティストとして、若者たちの道標となりたいです。

ありがとうございました。

関連する記事