【書評】施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方

齋藤さんと安井さんの「施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方」を読んだので、まだ隅々までは読めていないが、感想を書きます。

今回の書籍は初学者向けというよりは、すでに業務等の実践で機械学習をガンガン使っている人向け、もちろんこれからという人も事前に読むと実践の場面でとてもスキルが活きると思います。これまで、共著の安井さんは、「効果検証入門〜正しい比較のための因果推論/計量経済学の基礎」という書籍を以前書かれていて、合わせて読むと効果的とも思いました。

基本的に機械学習をベースに「推薦」の内容でバイアスも考慮した具体的な解説と実践的なコードがここままでわかりやすく書かれている書籍は他にはないと思います。

本書の概要
- 感想
1章機械学習実践のためのフレームワーク
2章機械学習実践のための基礎技術
3章 Explicit Feedbackを用いた推薦システム構築の実践
4章 Implicit Feedbackを用いた推薦システムの構築
5章因果効果を考慮したランキングシステムの構築
- 終わりに
- 参考図書

本書の概要

感想

まずいきなり、「機械学習を使ってまで解くべき問題はあくまで意思決定の最適化問題であって、予測誤差の最小化問題を解くべきではありません」というのはそのとおりで、データサイエンティストが陥りがちな急所をよく突いているなと思いました。

1章機械学習実践のためのフレームワーク

1章ではフレームワークについて言及されており

KPI を設定する
データの観測構造をモデル化する
解くべき問題を特定する
観測データのみを用いて問題を解く方法を考える
機械学習モデルを学習する
施策を導入する

このフレームワークを実践することで「機械学習モデルを学習する」の部分がとても活きていくるということを述べられております。

2章機械学習実践のための基礎技術

2章以降は上記のフレームワーク則り、正確な予測と高性能な意思決定を導く流れが具体的に記述されていて、なるほどなと思わされました。また私が一番うれしかったのはOpen Bandit Piplineについての言及があったことです

github.com

以前発表があったときにちょっとやってみようかなぁと思ったのですが、当時私の理解が浅かったこともありうまく手をつけられなかったのですが、本書では詳しく解説されているし、サポートページでJupyter Notebookもあるので、あーこういうことねっていう使い方がすぐわかります。

github.com

Notebookや書籍にも書かれている通り、全データは11G程度あるので、まずはサンプルでやるのをおすすめします。

ここのことですね、data_path=Noneでいけます

https://github.com/st-tech/zr-obp/blob/3cb08b507e6c1b351d94e22b6a9d9f88d6f1cc88/obp/dataset/real.py#L42

全データはメッチャ重いが現実のデータを想定するとこのくらいでも不思議では無いので感覚を掴むには良いかと思います。また、多くの方がこのようなlogデータを取り扱うと思うのでどのようなデータがアレばこのフレームワークに収められるのかということを理解するためにもぜひ実行しながら読みすすめることをおすすめします。

3章 Explicit Feedbackを用いた推薦システム構築の実践

ここからは思っきり推薦の話です。推薦には、☆ x 3のように「明示的」に評価がされているものとログデータにおけるコンバーションポイントのクリックのように「暗黙的」に評価がさえているものに分かれます。3章はExplicit Feedback（明示的の方）を扱っています。私は、MFを業務でガンガン使っておりますが、バイアスの考え方を含め今後の参考になることがたくさん記述されおりました。また、Yahoo! R3データは使ったことがなかったのですが、とても興味深い結果になっており実践のデータに適用してみたいなと思いました（MFのコードは巨大なデータを使うのでCythonで実装されたものを使っているのですが傾向スコアやナイーブ推定量を考慮した実装を書かなきゃいけないなぁ・・・なんておもったり）

4章 Implicit Feedbackを用いた推薦システムの構築

実践の場ではExplicit Feedbackはほぼ無いので、どちらかといえば私の興味はこちらの、 Implicit Feedbackの推薦システムです。こちもフレームワークに則り、ランキング学習に焦点を絞って語られており、Pytorchでの実装もとてもわかり易く結果もとてもおもしろい結果が見えています。

5章因果効果を考慮したランキングシステムの構築

こちらは更に発展的な内容で、4章においては、「真の嗜好度合いの総量の最大化」を問題設定としていたが、「推薦枠経由で観測されるコンバーション数や収益、コンテンツ視聴時間等のKPIの最大化」「推薦経由ではなく、プラットフォーム全体で観測されるコンバーション数や収益、コンテンツ視聴時間等のKPIの最大化」を問題設定としており、こちらは実際の実務に直結する内容で、速攻取り入れていきたいなというような内容でした。

あと、付録がとても充実していて、追加の解説や演習問題があるので理解が深まります。（演習問題の略解でもいいのでほしいなぁと思いました。合ってるのかどうか判断できないし）