くろたんく雑記帳

日常とか、わんちゃんとか、機械学習とか、競プロとか、

MENU

【書評】RとStanではじめる ベイズ統計モデリングによるデータ分析入門

馬場さんの「RとStanではじめる ベイズ統計モデリングによるデータ分析入門」を読んだので、感想。
今回の書籍はベイズ統計モデリングの初学者向けにぴったりで、内容がわかりやすくてガンガン読み進められた素晴らしい書籍。細かい話は概要に書く。


本書の概要

感想
  • 中身を見せてあげたいくらい、色味が目に優しくてよい。(自分が緑色が好きだというのがあるけども)
  • 数学的な議論が少ないけれど、数式は出てくる。しかしきちんと説明されているため理解が促される。
  • 統計・確率・ベイズ推論・MCMCの基礎をしっかり学べる。
  • 実際に推定結果の図示したり、どう見るのかということを説明している。
  • GLM→GLMM→DLM→DGLM と順にモデルを発展させて説明がされているため理解がしやすい。
  • 章ごとにテーマ・目的・概要、さらに具体例が書かれており、これは非常によかった。理解を促すなら、この形がいいと思った。
理論編

統計モデリングとはなにかという説明から、始まって以下がまとまっている。
(基礎という言葉は自分が勝手にそう思っているだけ。)

特に、よかったのは各項目にわかりやすい具体例が載っていること。統計にしても確率にしても数式だけで追える、理解できる人はいいが、具体的にどういう場面かというところから書いてくれることで置いてきぼりにならない。 4章の確率分布で扱っている、同時分布・周辺分布・条件付き確率の説明が非常にわかりやすく、つまずきポイントをうまく具体例を示して、理解を促している。 また、6-7章ではベイズ推論の難点、なぜMCMCをつかうのか、MCMCはどうやって乱数を生成しているのかをかなり事細かく説明してあるMCMCについてなんとなくの理解しかないなーっていう感じであればこの7章はかなり理解を促してくれると思う。

基礎編

まぁ、ここはRとStanのインストールと可視化方法などが主なので、基本省略。
5章がかなりよくて、結局結果をどう見ればいいの?っていうところをきちんとおさえてくれているのと、Stanに慣れてない人向けに6章でStanの文法の解説がコードと共にある。

実践編

まずはGLM。同じ事例で、線形予測子や、確率分布とリンク関数を変えた例を複数取り合えげているのでその違いが明確にわかる。まずは単回帰モデルでの推定および予測の実装例がある。 また、brmsをつかって簡単にベイズ統計モデリングを試みつつも、Stanで再現できるかということを実践している。これはとてもいいことでブラックボックスになっている部分をきちんと理解したうえで使えるようになることが重要である。 そのほか、正規線形モデル・ポアソン回帰モデル・ロジスティック回帰モデルを扱い、線形予測子や、確率分布とリンク関数を変えた実装例が書かれている。順序良く書かれているので、理解が促されやすい。

応用編

ここからはGLMM→DLM→DGLMという流れで書かれており、難易度もかなり高くなってくる。自分もDLMやDGLMについてはそこまで理解が深くなかったが、この書籍で一気にクリアになった。全体的に説明がわかりやすくてなぜそのように実装するのかというところが理解できるので、納得感が大きい


必要な前提知識

  • 統計・確率の基礎(理論編で具体例込みで結構書かれているので高校レベルで問題ない)
  • R・RStudio(今回必要な使い方の説明はきちんと書いてある)
  • Stan(今回必要な使い方の説明はきちんと書いてある)
  • 数学記号(どうしても条件付き確率の話が出てくるので{\displaystyle P(B \mid A)}

おすすめの人

  • 理論の復習したい人
    理論編の確率周り、ベイズ推論の難点からMCMCへ導入の説明。特になぜMCMCを使うのか、ここがめっちゃくちゃわかりやすい
    個人的にはここら辺が流れがわかりやすく。理論編だけでも、以下を「簡単な」数式で丁寧に解説されていて、初学者はもちろん、もう一度「おさらい」した人は読むといい。

  • 緑本読んで統計モデリングちょっとよくわからんなっていう人

  • 統計モデリングに興味はあるけど、数式の理解が苦手な人
    数学的な議論が少ないものの、数式は出てくるが、その説明はい非常に丁寧で、具体例もわかりやすい言葉で書かれている数式が出てくると「なんでこの変換???」っていうのも出てくるがそうならないように工夫が施されている。


終わりに

評判通り、非常に良本だった。 本当にベイズ統計モデリングの本はこれまで色々読んだが、自分としては、最もわかりやすく、ここから始めればその他参考図書も「すっと」頭に入ってくると思う。特に具体的な例で実践するのがオススメで、たのしいベイズモデリングの例を実践してみるのが良いと思う。

その他参考図書

たのしいベイズモデリング

面白いネタの事例が載っていて、内容が興味深くて非常に良い。データを取得するのが難しい場合があるが、色々想定しながら実装して見ると面白い。

StanとRでベイズ統計モデリング(アヒル本)

松浦さんの本。これもかなりわかりやすく書かれていて、合わせて読むことをオススメする。Stanの書き方もこれで学んだ。

statmodeling.hatenablog.com

緑本

統計モデリングの書籍としては超絶有名。多くの人がこの本からスタートしているかと。RとStanではじめる ベイズ統計モデリングによるデータ分析入門をよんでから、読むと理解しやすいと思う。


お願い(欲しい書籍リスト)

ずうずうしいのですが、ブログを続けるのも大変で、基本自分の学習メモのためですが、サポーター募集です。ポチッとしてくれると嬉しいです。

https://www.amazon.jp/hz/wishlist/ls/2EDNNTYRW2BJE?ref_=wl_share

もしくは、レビューなど書くので、献本していただけたらものすごく喜びます(お問い合わせ or TwitterのDMからお問い合わせ下さい。)