2021-08-09

【書評】機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック

森下さんの「機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック」を読んだので、まだ隅々までは読めていないが、感想を書きます。

Interpretable Machine Learningってとても話題で、最近だとHACARUSさんがInterpretable Machine Learningを翻訳して話題になっていたけどもこれともまた違った内容です。 hacarus.github.io どちらかというと、より実践的で、4つの機械学習の解釈手法をPythonで実装して、アルゴリズムを理解し分析から急所を捉えるといった構成になっていると感じました。

本書の概要
- 感想
終わりに
参考図書

本書の概要

感想

解釈手法をマクロな解釈手法からミクロな解釈手法と使い分けで段階としては

Permutation Feature Importance
Partial Dependence
Individual Conditional Expectation

という流れは非常にわかりやすかったです。またその解釈手法の使い方を安全か注意が必要かという点で区別しており、

モデルのデバッグ
モデルの振る舞いを解釈
因果関係の探索

という点で段階を分けて考えるというのは、実際の業務にも活きてくる内容と思いました。

書籍全体の流れは

線形回帰モデル
Permutation Feature Importance
Partial Dependence
Individual Conditional Expectation
SHapley Additive exPlanations

という流れで構成されており、私は特に後半の Individual Conditional ExpectationとSHapley Additive exPlanationsの章が秀逸と思いました。というのもこれらをここまで丁寧に説明している書籍が殆どないので、とても理解が深まりました（Permutation Feature Importance, Partial Dependenceに関しても同様です）

コードはこちらでサポートされています。

github.com

特に、交互作用はよく使い割に説明性が欠けることが多く、理論実装ともにわかりやすかったです。

SHapley Additive exPlanationsの説明はとりあえず僕が知る限り一番わかりやすかったので、これまで理解できなかった方も理解が進むのではないでしょうか？

私にとっては、このIndividual Conditional ExpectationとSHapley Additive exPlanationsの実装を試せたことが最大の収穫です。

あと何気に、付録のRの実装があったのがなにげに嬉しかった。そして、付録Bで「線形回帰モデルが元来備えている解釈」と「機械学習の解釈手法を通した解釈」が整合的であることを示しているのはとてもおもしろかった。むしろこれで完全に納得したといった感じです。

終わりに

すべての章に通じて言えますが、数学的な内容は最低限に抑え、高度な内容を平易な文章と簡易なコードでとてもわかり易く解説されていると思いました。

「解釈可能な機械学習」を題材に非常に勉強になる書籍でした。普段から意識はしているので、実践にすでに使っているものもあれば、これは使えるなという新しい発見もできました。このような技術はきちんと実践に活かせるようにならなくては意味がないので得た知識を実践に活かせるようになりたいものです。

参考図書

同時に出版されている齋藤さんと安井さんの「施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方」こちらも書評を書いてあるが、すでに業務等の実践で機械学習をガンガン使っている人向けで特に「バイアス」「反実仮想」を考慮した機械学習をフレームワークを提唱しており、私としては「「推薦」の内容でバイアスも考慮した具体的な解説と実践的なコードがここままでわかりやすく書かれている書籍は他にはないと思います

施策デザインのための機械学習入門〜データ分析技術のビジネス活用における正しい考え方

本書の概要

感想

終わりに

参考図書

本書の概要

感想

1章 機械学習実践のためのフレームワーク

2章 機械学習実践のための基礎技術

3章 Explicit Feedbackを用いた推薦システム構築の実践

4章 Implicit Feedbackを用いた推薦システムの構築

5章 因果効果を考慮したランキングシステムの構築

終わりに

参考図書

経緯

環境構築

TeXの知識吸収

どうやるか

結論

成果物

終わりに

はじめに

GraphQL-based API

経緯

PDB IDからのLigand情報の取得

終わりに

経緯

今後

簿記（2020-02）

はてぶ（2020-06~）

AtCoder （2020-05~）

書評 （2020-07~）

移住 (2020-07~)

スタサプ・TOEIC（2020-09-10）

業績まとめ

終わりに

サマリー

AtCoder Beginner Contest

169 C-Multiplication 3 (2020-05-31)

169 D - Div Game (2020-05-31)

170 D - Not Divisible (2020-06-14)

172 C - Tsundoku (2020-06-27)

172 D - Sum of Divisors (2020-06-27)

173 C - H and V (2020-07-05)

174 C - Repsept (2020-08-02)

176 D - Wizard in Maze (2020-08-22)

178 C - Ubiquity (2020-09-13)

180 C - Cream puff (2020-11-01)

181 D - Hachi (2020-10-17)

182 D - Wandering (2020-11-08)

183 D - Water Heater (2020-11-15)

184 D - increment of coins (2020-11-22)

186 D - Sum of difference (2020-12-19)

AtCoder Regular Contest

106 B - Value (2020-10-24)

109 B - log (2020-11-28)

110 B - many (2020-12-05)

最後に

参考書籍

1章機械学習実践のためのフレームワーク

2章機械学習実践のための基礎技術

5章因果効果を考慮したランキングシステムの構築

書評（2020-07~）