【書評】RとStanではじめる ベイズ統計モデリングによるデータ分析入門
馬場さんの「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」を読んだので、感想。
今回の書籍はベイズ統計モデリングの初学者向けにぴったりで、内容がわかりやすくてガンガン読み進められた素晴らしい書籍。細かい話は概要に書く。
買おう買おうと思ってずっと買ってなかったら、5刷になったばかりだった。ページを開いた瞬間から、色味が好みで、具体例たくさんで、すごい良い。
— くろたんく@激しく多忙 (@black_tank_top) 2020年8月5日
早く手を動かしながら読もう!! pic.twitter.com/bllta8Q9Tm
本書の概要
感想
- 中身を見せてあげたいくらい、色味が目に優しくてよい。(自分が緑色が好きだというのがあるけども)
- 数学的な議論が少ないけれど、数式は出てくる。しかしきちんと説明されているため理解が促される。
- 統計・確率・ベイズ推論・MCMCの基礎をしっかり学べる。
- 実際に推定結果の図示したり、どう見るのかということを説明している。
- GLM→GLMM→DLM→DGLM と順にモデルを発展させて説明がされているため理解がしやすい。
- 章ごとにテーマ・目的・概要、さらに具体例が書かれており、これは非常によかった。理解を促すなら、この形がいいと思った。
理論編
統計モデリングとはなにかという説明から、始まって以下がまとまっている。
(基礎という言葉は自分が勝手にそう思っているだけ。)
特に、よかったのは各項目にわかりやすい具体例が載っていること。統計にしても確率にしても数式だけで追える、理解できる人はいいが、具体的にどういう場面かというところから書いてくれることで置いてきぼりにならない。 4章の確率分布で扱っている、同時分布・周辺分布・条件付き確率の説明が非常にわかりやすく、つまずきポイントをうまく具体例を示して、理解を促している。 また、6-7章ではベイズ推論の難点、なぜMCMCをつかうのか、MCMCはどうやって乱数を生成しているのかをかなり事細かく説明してある。MCMCについてなんとなくの理解しかないなーっていう感じであればこの7章はかなり理解を促してくれると思う。
基礎編
まぁ、ここはRとStanのインストールと可視化方法などが主なので、基本省略。
5章がかなりよくて、結局結果をどう見ればいいの?っていうところをきちんとおさえてくれているのと、Stanに慣れてない人向けに6章でStanの文法の解説がコードと共にある。
実践編
まずはGLM。同じ事例で、線形予測子や、確率分布とリンク関数を変えた例を複数取り合えげているのでその違いが明確にわかる。まずは単回帰モデルでの推定および予測の実装例がある。 また、brmsをつかって簡単にベイズ統計モデリングを試みつつも、Stanで再現できるかということを実践している。これはとてもいいことでブラックボックスになっている部分をきちんと理解したうえで使えるようになることが重要である。 そのほか、正規線形モデル・ポアソン回帰モデル・ロジスティック回帰モデルを扱い、線形予測子や、確率分布とリンク関数を変えた実装例が書かれている。順序良く書かれているので、理解が促されやすい。
応用編
ここからはGLMM→DLM→DGLMという流れで書かれており、難易度もかなり高くなってくる。自分もDLMやDGLMについてはそこまで理解が深くなかったが、この書籍で一気にクリアになった。全体的に説明がわかりやすくてなぜそのように実装するのかというところが理解できるので、納得感が大きい。
必要な前提知識
- 統計・確率の基礎(理論編で具体例込みで結構書かれているので高校レベルで問題ない)
- R・RStudio(今回必要な使い方の説明はきちんと書いてある)
- Stan(今回必要な使い方の説明はきちんと書いてある)
- 数学記号(どうしても条件付き確率の話が出てくるので)
おすすめの人
理論の復習したい人
理論編の確率周り、ベイズ推論の難点からMCMCへ導入の説明。特になぜMCMCを使うのか、ここがめっちゃくちゃわかりやすい。
個人的にはここら辺が流れがわかりやすく。理論編だけでも、以下を「簡単な」数式で丁寧に解説されていて、初学者はもちろん、もう一度「おさらい」した人は読むといい。統計モデリングに興味はあるけど、数式の理解が苦手な人
数学的な議論が少ないものの、数式は出てくるが、その説明はい非常に丁寧で、具体例もわかりやすい言葉で書かれている数式が出てくると「なんでこの変換???」っていうのも出てくるがそうならないように工夫が施されている。
終わりに
評判通り、非常に良本だった。 本当にベイズ統計モデリングの本はこれまで色々読んだが、自分としては、最もわかりやすく、ここから始めればその他参考図書も「すっと」頭に入ってくると思う。特に具体的な例で実践するのがオススメで、たのしいベイズモデリングの例を実践してみるのが良いと思う。
その他参考図書
たのしいベイズモデリング
面白いネタの事例が載っていて、内容が興味深くて非常に良い。データを取得するのが難しい場合があるが、色々想定しながら実装して見ると面白い。
StanとRでベイズ統計モデリング(アヒル本)
松浦さんの本。これもかなりわかりやすく書かれていて、合わせて読むことをオススメする。Stanの書き方もこれで学んだ。
緑本
統計モデリングの書籍としては超絶有名。多くの人がこの本からスタートしているかと。RとStanではじめる ベイズ統計モデリングによるデータ分析入門をよんでから、読むと理解しやすいと思う。
データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者:久保 拓弥
- 発売日: 2012/05/19
- メディア: 単行本
お願い(欲しい書籍リスト)
ずうずうしいのですが、ブログを続けるのも大変で、基本自分の学習メモのためですが、サポーター募集です。ポチッとしてくれると嬉しいです。
https://www.amazon.jp/hz/wishlist/ls/2EDNNTYRW2BJE?ref_=wl_share
もしくは、レビューなど書くので、献本していただけたらものすごく喜びます(お問い合わせ or TwitterのDMからお問い合わせ下さい。)