金融系データサイエンスカオスマップ2020年版
今回のエントリでは金融系におけるデータサイエンス案件のカオスマップです。2020年版における以下の4分野における取り組みをまとめてご紹介いたします。
- 銀行
- 証券
- 資産運用
- 保険
①銀行向けデータサイエンス案件
与信分析系
銀行の本業は預金者からの預金を融資して、その利子で利益を出すことです。ただし、貸し出す先はのべつ幕なしに誰でも良いというわけではありません。そのためしっかりとした融資先を見極める必要があるのですが、昨今の金融緩和から貸し出す先が銀行間で奪い合いになり与信がしっかりしたとすぐに判断できる債務者は減ってしまいました。そこで、今までよくわからないし融資金返済してくれるのかな?と疑問だった融資先候補をデータサイエンスの力で、「疑問だったけどしっかり返すと思われる融資先」と「そうでない怪しい融資先」に分類する取り組みが始められます。この取組に関してはこの投稿でデータを用いながら解説しています。
※余談ですが、昨今〇〇PayというPayアプリが流行っておりますが、それらはプラットフォーム化することでそのアプリを通じた支払いの手数料で儲ける他、支払いの状況から与信の推測をたてるためのデータ収集の目的を兼ねていて最終的に銀行の機能を代替したいと考えていると思われます。
②証券会社向けデータサイエンス案件
証券会社のデータサイエンスおよびデータアナリティクス案件としては、①顧客営業に対する最適銘柄推奨や②自己勘定やブローキングによる取引執行の最適化が挙げられます。
対面証券における営業効率最適化系
昨今、フィデューシャリー・デューティー(Fiduciary duty)、いわゆる顧客本位の営業が叫ばれている中、証券会社が一方的に売りたい商品だけを考えて営業すればよいというわけではなくなっております。そのため、
- 証券会社として売りたい商品
- 本当に推奨すべき顧客でニーズがある
という制約を満たす取引機会を過去のデータから判定して営業するということが求められます。凄まじく大雑把に言うとリスク許容度の高い富裕層に対してはリスク性の高い仕組債や私募ファンドなどを、資産形成層には前述のものより流動性の高いリターンも限定的な商品(株・債券など)を顧客の相場観と合致するように商品の紹介をするといったことを達成するためにデータサイエンスで分析をすることが求められます。
統計的な取引執行最適化
証券会社はバイサイド(運用会社)から執行の依頼を受けて、注文を取引所に流します。その執行方法の例としてザラバにおける取引量に応じた加重平均(Volume Weighted Average Price=VWAP)になるべく近くなるように取引を依頼されることがあります。ただし、当日のある時点の取引量はその時にならないとわからないため、どうしても誤差は生じてしまいますが統計的に予測をすることで、その誤差を少なくすることが挙げられます。この分野は執行系アルゴリズム取引と言って、データサイエンスの勃興以前からあるものですが、昔は執行職人がいてオーダーを出していたということを聞いています。クライアントに対する説明もあり、この分野にもデータサイエンスが活用されております。
[参考]
野村資本市場研究所|人工知能・ビッグデータを活用した資産運用への期待と課題
URL:http://www.nicmr.com/nicmr/report/repo/2017/2017spr06.pdf
③資産運用会社向けデータサイエンス案件
資産運用会社向けはすでに整理されたものを参照しながら解説していきます。以下は野村総合研究所が2018/2019年にまとめた資産運用会社におけるAI(いわゆる機械学習)の適用分野です。
[参考]
www.nri.com
こう見ると、活用領域が大きい順に以下のようになるかと思います。
- 投資判断
- データ収集・アグリゲーション・分析
- リスク管理
- トレーディング戦略の立案・評価・執行
投資判断系
こちらはAIと記載されていますが、ベースになっているのは機械学習の技術と思われます。
それを実装するのはやはりデータサイエンティスト兼クオンツになると思うのでまだまだドメイン知識が問われる領域ではないかと個人的には思います。
データ収集・アグリゲーション・分析系
こちらは泥臭い作業でますますデータサイエンティストが担う仕事の部分が大きいと考えています。
衛星画像を利用したTELSAの出荷台数予測による投資判断などもこちらの領域にあたるのではないでしょうか。
他にはどれだけ効果があるのかわかりませんが、SNSによる口コミで投資対象の企業に与える影響を測ることなどが研究されています。
リスク管理系
こちらはプロアクティブなリスク管理という分野で使われていると聞きます。私は実測度の世界でVaRなどによる最大損失額のマネジメントなどのプロジェクトに関わっていたことがありますが、どちらかというとそのような静的なリスク管理ではなくポジションに対する事前のリスク評価(統計情報を利用した)に活用されている認識です。
トレーディング戦略系
前述のVWAPの注文の例で言えば、VWAPは1つの戦略にすぎないので、引けで買う・寄り付きで買う(単純な例です)といったバイサイド側トレーダーの取るべき戦略の統計分析などがこちらに該当すると思われます。
④保険会社向けデータサイエンス案件
[損害保険]クレームが生じる要因分析
保険会社で数理的なプロフェッショナル資格といえばアクチュアリーでしょう。
少々余談ですが、自分もアクチュアリー試験の1次試験のいくつかを受験して合格していますが、統計学における分布の種類を覚えるのに適した試験だなぁと感じました。
そんなアクチュアリーの業務の一つに、対象の契約に対して、クレーム(保険金請求)がかかる確率とその規模をモデル化して保険商品のプライシングがあります。
損害保険の分野では自動車事故を起こしやすい人・起こしにくい人の特徴をアクセルやブレーキの使用状況に加えて、走行ルートなどを組み合わせることで事故発生確率をより正確に推計して現在の等級制度より精緻なプライシングで、事故を起こしにくい人には安価に、起こしやすい人にはより負担がかかる仕組みするといった取り組みが挙げられます。少々古いですが、以下のURLが参考になります。
[生命保険]デジタル診断系
一方生命保険では、寿命表(※年々更新され日本の表だと長寿化の傾向があります。)をもとに保険料を計算したりするのですが、あまりデータサイエンス案件の事例を聞きません。こちらは根ざしているのが寿命と病気への罹患率であることから医師よりもデータサイエンティストがパフォーマンスできる部分が限られているためと考えています。ただ、一方でレントゲン写真などをデジタルデータで取り込んで病気の特定に利用するケースなどがありますので、そちら方面が生命保険会社としての取り組みに該当するかもしれません。(やや強引ですみません。)
CTやレントゲン画像からの症状検出を人間医師/技術者より正確に行う機械学習ソフトウェアBehold.ai | TechCrunch Japan
以上です。