ホーム > NSSOLテック・コラム > データセキュリティ > 匿名加工をテーマにしたセミナーに登壇 ~安全・安心なデータ活用を実現する「データセキュリティ」~

NSSOLテック・コラム

データセキュリティ

2019/07/11

匿名加工をテーマにしたセミナーに登壇 ~安全・安心なデータ活用を実現する「データセキュリティ」~

購買履歴や行動記録といった個人データを分析し、自社のビジネスに活用する動きが本格化しています。今後データ活用はさらに多様化し、企業間でのデータ連携やデータそのものを売買するといった動きが活発化していくと予想されます。そうした動きの中で注目を集めるのが、個人を特定できない形にデータを加工する「匿名加工」技術です。NSSOLでは2014年に匿名加工技術の研究開発に着手しました。

今回は、昨今の匿名加工技術の動向を肌で感じ続けてきた波多野さん(システム研究開発センター)に、最新の動向をお聞きしました。

匿名加工技術の普及のために

まずは匿名加工技術について、簡単にご説明いただけますか。

波多野:匿名加工技術が注目されるようになったきっかけとして、2017年5月施行の改正個人情報保護法が挙げられます。それまで個人情報は、基本的に取得時に明示した「利用目的」に沿った利用しかできませんでしたが、特定の個人が識別できない形に加工すれば目的外利用ができるようになりました。ここで重要なのは、特定の個人が識別できない形にするとともに容易に復元できないように加工するのが匿名加工情報だということです。例えば、個人情報を暗号化することで、一見して個人が特定できない形にできますが、鍵によって復号すると特定できてしまいますので、これは匿名加工情報にはなりません。

私たちは、企業の持つビッグデータを「どう匿名加工すれば安全なのか」といった技術を研究するとともに、「匿名加工とはどういうものか」をお客様に知って頂くための技術紹介や、実際に体験してもらうためのハンズオンといった活動をしています。

そうした活動を通して「匿名加工」の最近の動向をどうとらえていますか。

波多野:データの利活用は進んできていますが、現時点ではまだ自社で集めたデータを自社の企業活動に活かしている、というフェーズ。ここから一歩進んだ“企業間でのデータの流通”という点では、個人情報などの機微な情報の扱いが難しく、まだ取り組めていないことが多いです。本格的なデータの流通にはもう少し時間がかかりそうですが、お客さまからは「データ流通に向けて何か良いソリューションはないか」といった問い合わせは増えてきています。

こうした状況の中で大学や関連機関では、匿名加工技術の啓蒙活動や技術者育成講座など、さまざまなセミナーが開催され始めています。今回、そのようなセミナーの主催者様からお声かけを頂きまして、私が講師として登壇してきました。

どのようなセミナーだったのでしょうか。概要を紹介いただけますか。

波多野:私が登壇したのは産学2つのセミナーでして、1つは2月の「匿名加工情報連続セミナー~データ利活用に向けて」(主催:日本データ通信協会(JADAC)/電気通信個人情報保護推進センター)。もう1つは、3月の「データサイエンティストのための情報セキュリティとプライバシー」(主催:早稲田大学)でした。

認定個人情報保護団体でもある日本データ通信協会様は、個人情報・匿名加工情報の適正な取扱いに関する支援活動の一環として、法律や技術など各種セミナーを行っています。私は全10回のセミナーの第5回目にハンズオン、第6回目にパネルディスカッションを行いました。

JADACセミナーの様子

なぜ、NSSOLに声がかかったのでしょう。

波多野:匿名加工技術を競うコンテスト「PWS Cup」で入賞実績があることと、匿名加工技術が実際に体験できるハンズオンを開発していたこと、が大きいです。他のセミナーでは講義形式での説明が多いため、実際に手を動かしてみて理解を深めて欲しい、というのが主催者側の趣旨だったようです。

他の講師のみなさんは、匿名加工の世界ではオールスター級の方々ばかりでした。その中で「私が講演していいの?」という驚きはありました。

波多野さんはまだ入社4年目でしたからね。ハンズオンの内容は以前開発したものを使ったのですか?

波多野:そうです。今回のセミナーに向けて一部チューニングしましたが、ほぼ同じ内容です。ハンズオンの内容については、以前のテックコラムで詳しく紹介していますので以下をご参照ください。

改正個人情報保護法の全面施行で注目が集まる匿名加工技術 匿名加工体験ハンズオンを開発、匿名加工の理解をサポート

概略だけ説明しますと、参加者はクレジットカード会社の社員になって、カード利用者の個人情報を匿名加工して新たなビジネスに適用してみよう、というものです。実際に1人か2人に1台ずつ、作業用の端末を用意して、実際に匿名加工を実施して頂きました。

30~40分ほどのワークショップを通じて、
1. 安全で有用な匿名加工情報は、簡単には作成できない
2. 活用する際には、いろいろ注意しなければならない
主にこの2点を学んでいただくことを目的に開発したハンズオンになります。

参加者の顔ぶれや反応はどうでしたか。

波多野:参加いただいた方の半分くらいは、データ分析に携わる技術者や研究者の方でした。残りの半分は、企業の情報システム部門担当者などで、データを利活用し、新たなビジネスやサービスを開発したいとの想いで参加されていたと思います。

中には、「導入できるソリューションはないのか」「会社に実際に来て、現状を見てもらいたい」など、今すぐにでもデータの利活用をビジネス導入したい。そんな、積極的な企業も見られました。

なるほど。では、もうひとつの早稲田大学のセミナーについてもご紹介ください。

波多野:早稲田大学様では、『D-DATaプログラム』という、データの利活用に強い専門家を育成するためのコンソーシアムを主管しています。そのプログラムの一環で、「データサイエンティストのための情報セキュリティとプライバシー」、という講座の一部を担当させて頂きました。 参加者の大半はデータサイエンティストを目指して学んでいる学生や社会人修士の方でした。

内容は同じとのことですが、反応のちがいなどはありましたか。

波多野:「実際に体験してみると『匿名加工技術』の理解度が深まる」といった声が聞かれました。参加者の多くは、普段から生データを扱ってデータ分析を行っている学生です。そのためデータにノイズを加えたり曖昧にしたりして情報量を落とす、という体験は新鮮だったようです。また、普段生データを扱っている社会人修士の方からは、「個人情報満載の生データばかりを扱っていると、何だかあまりに見え過ぎてしまい、気分が悪くなることがあった。でもこのように加工されていれば安心して分析できる」という意見も聞かれました。必要に応じて情報量を落とすことの利点も理解頂けたと思っています。

産学による意識や見識のちがいはありましたか。

波多野:アカデミックの現場では、匿名加工技術を活用すればすぐにビジネスに結びつくとの考えがあるように感じました。しかし実際にビジネスの現場にいる私たちの意見としては、乗り越えなければいけない壁はまだまだある、というのが正直なところです。実際、匿名加工技術を研究している機関や企業はまだ少なく、その先のビジネスにまで取り組めている企業となると、ほんの一握りですからね。

センシング技術の発達や「次世代医療基盤法」など、データの利活用は着実に進んでいる

データの利活用のトレンドについて聞かせてください。

波多野:データを取得する技術が発達したことで、あらゆる業界やシーンでデータの利活用が広がっていると感じています。たとえばスポーツ。特に海外では顕著で、アメリカのメジャーリーグでは投球・打球・守備などの様々なデータを収集し、高度な分析結果に基づいて最適な采配を取る、という仕組みが多くの球団で取り入れられていると聞いています。

日本国内に関しては、特に医療分野のデータ利活用に興味を持っています。これまでは、患者さんの診断結果や医療行為の記録は、基本的にかかりつけの病院内やその系列内でのみ共有されていたため、医療データの活用が限定的になっていました。この状況に対して、2018年に医療データの活用を推進するための法律「次世代医療基盤法」が施行され、病院が取得したデータはいくつかの認定機関に集約されることになりました。集約されたデータは、必要な匿名加工処理をされた後に研究機関に提供されて、研究開発などに活用されます。認定機関に集積された大規模医療データからどのような研究ができそうか、またその研究を実現するためにどのような匿名加工が必要なのか。強い興味を持って注目しています。

「データを一切外に出さない」という従来の考えから、「データを流通・共有する」時代になってきているわけですね。

波多野:ええ。そしてその際に、先ほど紹介した匿名加工技術が、解決策のひとつとして注目されています。JADAC様のセミナーや早稲田大学様の講座に招かれたのも、そうした風潮からだとも思います。実際、さまざまな業界のお客様から、匿名加工技術をきっかけとしてデータ利活用の相談や問い合わせをいただく機会が増えています。今後、医療業界でのデータ活用の良い事例が出れば、さらに匿名加工情報の流通に強い関心が向けられることになると思っています。

そのような状況にあって、シス研も含め匿名加工情報に携わる技術者が留意すべき点はありますか。

波多野:先ほども少し触れましたが、どこまで匿名加工するのか。そのさじ加減の見極めを常に意識しています。データの利活用とセキュリティは、いわば相反関係。セキュリティを高めすぎると利便性は低くなってしまうことが、往々にしてあるからです。利用用途やデータを扱う企業の方針などに応じて、どの情報にどの程度加工を施して安全にするか。そして、特定の個人を識別できないように加工された情報が、どこまで有益なデータとして使えるのか。このようなバランスを、我々は常日頃の研究で意識しています。

「数字は嘘をつかない」データ分析一筋。これからは他のセキュリティ分野にも注力したい

ところで、波多野さんがデータに興味を持ったきっかけは何だったのですか。

波多野:スポーツのデータがきっかけでした。特に野球が好きで、小さいころから野球のテレビ中継をよく見ているのですが、 解説者が「三者凡退でテンポよく終わったので、次の回は点がはいるのでは」とか、「先頭打者にフォアボールは流れが悪い」といったコメントをするのをよく耳にしますよね。また、最も強い打者は4番に置く、などの定石もあります。それは本当に正しいのか、よりよい戦略はあるのか、と疑問を持ちました。そこでメジャーリーグの80年分ほどのデータを用意してみて、集計・シミュレーションして、いろいろな主張の正しさを確かめてみました。

それで、結果はどうでしたか。

波多野:「なるほど合っている」というものもあれば、そうではないものもありました。打順のシミュレーションをしたときに「松井秀喜は4番ではなく、1番に置いたときに最も点が入る」という結果が出たときは面白かったですね。それ以来、手元で世の中の定説の仮説検証することに喜びを感じています。

このような流れで、大学・大学院時代の研究でもデータ分析を行いました。修士論文では医療系ビッグデータを活用し、機械学習の手法を利用してがん治療の最適化を行う、というテーマに取り組みました。卒業後も様々なデータの利活用に携わりたいと考えてNSSOLに入社して、今に至ります。

データ分析一筋、というわけですね。

波多野:入社してからは、データの活用を安全にかつ安心して実施できるための技術:「データセキュリティ」の研究開発に取り組んできました。匿名加工技術は、この研究テーマの要素技術のひとつになります。

なるほど。最後に、今後の研究開発活動の展望についてお聞かせください。

波多野:データセキュリティの研究開発として注目している技術は、今回紹介した匿名加工のほかには、「統計化」、情報に鍵をかけて管理する「暗号化」、情報を安全な複数の断片に分けて管理する「秘密分散」があります。

匿名加工技術については、これまでの活動が実を結び、お客様の中でNSSOLの名前が挙がるような状況になってきており、実際にビジネスに繋がるご相談を頂けるフェーズにまで成長しています。今後は他の要素技術の研究開発を加速させて、お客様の安心・安全なデータの利活用を包括的にサポートできるようになりたい、と考えています。

ありがとうございました。

■情報セキュリティに関する問い合わせ
システム研究開発センター
データ分析・基盤研究部
波多野
sysrdc-i-datatech-manager@jp.nssol.nipponsteel.com

関連する記事