ベイズの苦悩


 最近、学会の時に作った階層ベイズモデルをこの期に及んで、いじろうかと努力しているところです。
 ま、初心者に毛の生えたような僕が突貫工事で仕上げたブツ故、問題ありありなのですが、そこを弱い頭をひねってどうにかしようとしているわけです。

 というわけで、とりあえず現時点での問題点を備忘録としてピックアップ。

・林床光環境問題
 地形による被陰と樹冠による被陰を別個に変数として入れても、そりゃあてはまり悪いのは当たり前。
 モデルの中で、どうにかして改良してやる必要あり。隠れ変数的にしてやるのもいいかもしれん。つっても、イマイチ隠れ変数のことわかっていないので、今後お勉強せんといかんです。

・時間スケール問題
 ま、林齢が林床植物群集を規定していると言うのは簡単なものの、林齢を固定効果な説明変数として使うのは良くないような気が。
 光環境を規定しているっていうのはあるが、それよりかは林床植物の人生(種子供給とか種間競争)みたいなものの影響が大きいのでは。
 ってすると、スケールを空間スケールから時空間スケールに拡張する必要があるかもしれん。つっても現時点では1時点データしかないので、2時点目取ったときのお楽しみか。でも1時点でもどうにかしたい気も・・・

・種間競争問題
 今回は、個体をざくっとポイントのような扱いにしてしまっているわけですが、当然個体は高さや種特性も違う。
 てことは、機能タイプや高さデータを能動的に入れてあげないといけないのかも。つっても、こればかりはノーアイデア。

 なことをぼ~んやり考えてたらkuboさんとこでも同じような話が出てたので、勢いで抜粋。

ふーむ …… 今までいいかげんにデータ解析されてた分野, とくに群集生態学なんかは今後は Bayes 化が進行していくのは マチガイないところだろうとおもうんだけど, このデータ解析でも見られるようになかなか面倒な部分がある. それは群集内の種間の相互作用の推定というやつだ.

生態学でいう相互作用とやらは (相関ではなく) 因果関係であり, 因果関係を推定したいならば原理的には時間変化データが必要とされる. しかしながら, なかなかそのようにはデータがとられていない. データがないのに相互作用らしきモノを無理矢理に推定しようとすると こういう悪戦苦闘状態におちいる.

それじゃー気あいと根性で時間変化データとりゃあいいのか, というとハナシはそう簡単ではない. 昆虫とかの動物群集の場合, 群集の変化はわりと短期間に観察されるんだけど, 季節変化とかイヤな外力に振りまわされる部分が大きいので, データとる回数が増えるにつれ次第に様相が複雑怪奇化していく, つまり自滅的な状況におちいったりすることなんかも.

いっぽうで植物群集なんかだと変化はもっとゆっくりしてるんだけど, ゆっくりしすぎていていったい何年ぶんのデータとれば 言うところの相互作用とやらが推定されるの? ということになりがち.

ベイズ統計学の推定計算にもちいられる Markov chain Monte Carlo (MCMC) 計算, その故郷である統計力学でかくのごとき計算方法が発達してきた背景には 「相互作用の強さの推定が困難 (だけど推定したい)」 を克服することにあった. すなわち, システムの構成要素間のミクロな相互作用が推定困難な (何が原因で何が結果なのか観測による識別がしんどい) 状況のもとで, システムの内部状態の可能なパターンを列挙 & システム全体のマクロな統計量を算出できるところがウリになっている.

まあ, 放棄スキー場植生の問題にたちかえると, ここで推定がうまくいってない理由は …… たとえばある quadrat で稚樹の本数がゼロだったときに, このモデルに組みこまれているふたつの説明

  1. 「ここは草本がたくさんいるから樹木稚樹は少ない」 (fixed effects 的)
  2. 「この場所にはそもそも樹木なんていないんだよ」 (random effects 的)

推定計算の中でこれらの 「オレが正しい (オレが尤度を改善してやってるんだ)」 バトルの決着がまったくさだかではなく, いつまでたっても 「やっぱり草本による shading」 – 「いやいやそもそもいないんだ」 の両者のあいだを激しくふらふらさまよっている (つまり熱力学的平衡とゆー範囲をこえて挙動に落ちつきがない) ことにありそうだ.

 てことで、自分の場合に立ち戻ってみると、GLMの延長上にランダム効果と固定効果のかけ算な要因を持ってくるのは、あんま良くないということで、良いんだろうか。ま、測って固定効果にしてしまえば良いんだろうが。あ、そういやシカが食べちゃって生えないということもあるんだった。ま、それはウンコを数えるので固定効果にしてしまえばいいか。

 なことを、ぐるぐる考えていくと、測ってないもんは結局わからないんだ、という極当たり前な結論に落ち着くわけです。だからといって、測りまくるというのも、ブルーカラーなお仕事の無限ループとなってしまう恐れが・・・

 はあ、妖精さんがそゆうめんどくさいことを全部してくれればいいのに・・・