統数研のフィールド生態セミナー行ってきた


一昨日から統計数理研究所であった”フィールド生態学と統計数理”なるセミナーに行ってきました。誘ってくれた富田さんありがとうございました。それと、主催してくれた島谷さん、わけの分からん馬の骨に発表の機会を与えていただきありがとうございました。
もうなんかお腹いっぱいです。初日はすんごくマニアックな角度統計の話にはじまり、ベイズがらみの話が遺伝、フジツボ、鳥、植物等々。
二日目は、点過程の話からデータ同化云々。
今回は発表もしたのですが、得られるものもたくさんあって、ここに至るまではいろいろ大変でしたが、参加してよかったです。

ちゃんと自分が思ったこととか残しとかないと、すぐ忘れるのでメモ。
後、kuboさんがきちんとまとめられているので、そちらを見た方が間違いなく参考になります。

KuboLog 2009-10-(21-31)

清水先生の角度統計の話

方位とか角度のデータは、ミニマムとマックスが同じという厄介なデータなわけで、方位とか斜面傾斜とかデータをいちおとっても結構日の目を見ないことが多いわけで。そういうデータを扱うときに使える確率分布があるよ、というお話。あ、そういや全天写真とかもろ角度データでは、と気づき、清水先生に相談したら、ま、別に今までどおりでいいんでないの?というお言葉いただき、ちと安心。

自分の発表

なんか、お仕事がらか、えらくおかたい話になてしまったようで、少し反省。んーでもあれ以上くだけると、いろいろと支障がでるかもな。ない頭使って必死に理解したクリギングまわりも、いざ説明すると全くうまく説明できませんでした。やっぱ人に説明するとなると、なんとなく理解できたくらいでは説明できんですね。もちっとしっかり理解しておくようにしないと。
モデルのところを説明してた段階で、富田さんから”それってMCMCやっても収束しないんではないですか??”なツッコミが。むーそんなはずはないんですがね。動揺しまくって、質問の趣旨を完全に理解できてはいなかったのですが、発表終わっていろいろ聞いて整理して見たところ、どうも説明がうまくいってなく、誤解されてしまってたようでした。
それと、擬似開空度サブモデルまわりでも、ツッコミが。うーん、シカまわりで聞かれるかなーとか思い、ざーっと理論武装してたのだが、そっちの方はあんまり考えていなかったり。
んで、発表の後に、kuboさんから擬似開空度モデリングまわりでいろいろとアイデアをもらって、かなりすっきりしてきました。
いずれにしろ、もうちょっといい方法考える必要ありです。
それと、帰りがけにもkuboさんからいろいろとお話聞いていたのですが、その中で、以前ODさんからも突っ込まれた種間競争の話が。実は、いつか光環境モデルと同様に、どうにかしないとと思い、メモまで残しておいてたわけですが、いつの間にか勝手に棚上げしておりました。んですが、kuboさんの経験談によれば、そんなにたくさんの種の関係をパラメータ表現するのは,WinBUGSではしんどいみたいです。むー確かにこれ以上パラメータ増えても、ですね。
それと、榎さんから林業を全面に出すとやってること誤解されそう、とのアドバイスいただきました。やってる仕事は林業なんですけど、別にthe林業な因子(間伐率なりなんなり云々)ががっつり効くような仕組みではないんですよね。注意しなければ。
ともかくいろいろアイデアもらえたので、モデル改良あたりからはじめないと。シカは。。。うん、ちょっと忘れよう。

富田さんのアカエゾマツ遺伝的多様性の話

学会でも話は聞いたことがあったので、多少理解していたつもりだったにも関わらず、うーんまだ完全に理解できてないかも。やっぱりMCMCをフルスクラッチで書くくらいしないとだめってこと?結果としては、そんなに遺伝的多様性は低下しませんよ、な結果だった、と理解してます。いやー植物って強いですよね。前説では、昨今のベイズ祭について、そんなんじゃいかんよ、な問題提起。祭は祭で、楽しいからいいやーとか思ってましたけど、そんなんぢゃダメですね、反省。

深谷さんのフジツボ状態空間モデル

フジツボの季節変動パターンを状態空間モデル使って、出しましたよというお話。
状態空間モデルも理解できてないのですごく勉強になりました。今のデータもずっと測っていくだけでもどうしようもないので、いずれは時間スケールにも拡張しないといけないわけですが、イテレーションが100万回って。。。

田中さんのNeyman-Scottクラスター点過程の尤度関数のお話

ここから、二日目のお話。このお話が今回の発表の中で、一番感動しました。Neyman-Scottクラスター点過程とは、点配置がネストしているというか、点のまわりに、また点が分布しているという点過程。
銀河系の星の分布を表すのに使われたのが、始まりらしく、できたのは1958年と結構歴史ある点過程だそう。
ただ、尤度関数を導出するのはかなり難しく、今まではノンパラとするのがセオリーだったのだそうな。それをうまく尤度関数で表すことができるようになったというのが、今回のお話。その式も見せてもらったのですが、僕のチンケな頭では理解不能でした。
ただ、積分の計算が統数研のスパコンでも2、3日かかるそうな。でも、これが普及すると例えば、主旨散布の話とか、動物の分野にも応用できそうな気がします。それとパラメータが何かしらの意味を持つ値であるとなれば、時間のかかる尤度関数の積分とかも回避できるのかな?
ああいう式ができるときって、ひらめきみたいなものがあるのだろうか。知識の積み上げなのだろうか。数学センスの欠如した僕にはとても無理そうです。

上野さんのデータ同化の話

データにシミュレーションモデルをベイズの枠組み使って当てはめるというデータ同化のお話。でもこれってベイズの話ですよね。データ同化なる名前つける理由ってなにかあるんだろうか?それとkuboさんが聞かれていましたが、システムノイズと観測ノイズを分離できないとかなると、ますますふつーのベイジアンフレームワークの方言のような気が。。。理解が足りてないのかなー

吉本さんの絶滅危惧種、森林経理学のお話

誰にも悲しまれずに絶滅していく森林経理学の、悲しいお話。。。。だったと思うのですが、時間が大幅におしていたため、最後まで聞けませんでした。ひっじょーに残念。吉本さんなのでOR周りの面白い話が聞けると一番楽しみにしてたのに。

その他どーでもいいこと

●なんか、スタジャン着てる人多いなーと思ったら、どうやら統数研の制服(みんなでお揃い買ってるだけ?)みたい。かっこいいけど、なんでスタジャンなんだろう。
●ゲノムとか、シミュレーションとかまったくの門外漢にも関わらず話を聞いていたわけですが、どうやらゲノム屋、シミュレーション屋にはそれぞれ解析流儀のようなものがあるらしく、その流儀にしたがわないと仲間にしてもらえないらしい。なんて、ヤクザな世界なんでしょう、と素朴に思うわけで。ただのデータじゃないんだろうか。なんか言霊みたいな、データ霊でもはいっているのかしらん。
●立川遠すぎる。危なく帰りも飛行機乗り遅れそうになってしまいました。
●なんか、みんな当たり前のように発表時間オーバーする。んなもんで、ひっじょーに楽しみにしていた吉本さんの発表が最後まで聞けず、しかも結構粘って聞いていたため、飛行機にも乗り遅れそうになるし。思いのたけを話すのはいいし、そういうの好きなんですけど、時間守るのは最低限のお約束ぢゃないんだろうか?ま、そういうこと気にしないゆるい集まりだったのかもしれないけど。

最後に

島谷さんは点過程の論文なんかを読ませていただいただけで面識全くなかったのですが、あんなに熱い方だとは想像してませんでした。おかげで、僕もモチベーションあがりまくりでした。
あと、近しいベクトルの人たちのお話聞くのはすごく楽しかったです。発表聞いてると、ここから何か変わりそうだなーなことを妄想してしまいたくなるような、そんな熱い集会でした。やっぱああいう集まりって大事ですね。

  • 「階層ベイズの乱」の話はいろんな人に誤解されてしまったのですが,あの話の主旨は「階層ベイズの乱」がいけないというわけではありません.あそこで言いたかったのは,科学の方法論としての統計モデルや階層ベイズの位置づけがまだ確立していないのに階層ベイズが流行ってしまったので,そういう議論を急がなきゃいけないだろうということです.

    • myuhe

      コメント、どもです。
      そういった議論を常にしていくことは、これから重要なことですよね。
      ただ、そういった議論をするほどにまでモデルやベイズの考え方が浸透しているのかなーという気もしますです。依然、統計解析は論文書くための通過儀礼だと思っている人はいまだ多くいるわけで、旧来の通過儀礼的統計解析っていうものに対して、統計モデルやベイズのフレームワークがどういう答を持っているかを多くの人に理解してもらうことの方が、優先順位が高い気がします。でないと、本当に”祭”で終わってしまうんではないか、と思うのですが。

      • > 統計解析は論文書くための通過儀礼だと思っている人はいまだ多くいるわけで

        おっしゃるとおりです.だから,道具としての統計モデルとか階層ベイズの位置づけをしっかりしないといけないわけです.従来の統計と階層ベイズが出す「答え」の違いを理解することも重要です.それと同時に,統計モデルがどういう考え(ここでは演繹推論的な考え)で問題を解こうとしているのかを理解することも不可欠でしょう.それらをあわせたうえで,統計モデルとか階層ベイズの位置づけをしっかり確立させていきたいものです.

  • myuhe

    コメント、どもです。
    そういった議論を常にしていくことは、これから重要なことですよね。
    ただ、そういった議論をするほどモデルやベイズの考え方が浸透しているのかなーという気もしますです。以前、統計解析は論文書くための通過儀礼だと思っている人はいまだ多くいるわけで、旧来の通過儀礼的統計解析っていうものに対して、統計モデルやベイズのフレームワークがどういう答を持っているかを多くの人に理解してもらうことの方が、優先順位が高い気がします。でないと、本当に”祭”で終わってしまうんではないか、と思うのですが。

  • 「階層ベイズの乱」の話はいろんな人に誤解されてしまったのですが,あの話の主旨は「階層ベイズの乱」がいけないというわけではありません.あそこで言いたかったのは,科学の方法論としての統計モデルや階層ベイズの位置づけがまだ確立していないのに階層ベイズが流行ってしまったので,そういう議論を急がなきゃいけないだろうということです.

  • myuhe

    コメント、どもです。
    そういった議論を常にしていくことは、これから重要なことですよね。
    ただ、そういった議論をするほどモデルやベイズの考え方が浸透しているのかなーという気もしますです。以前、統計解析は論文書くための通過儀礼だと思っている人はいまだ多くいるわけで、旧来の通過儀礼的統計解析っていうものに対して、統計モデルやベイズのフレームワークがどういう答を持っているかを多くの人に理解してもらうことの方が、優先順位が高い気がします。でないと、本当に”祭”で終わってしまうんではないか、と思うのですが。

  • myuhe

    コメント、どもです。
    そういった議論を常にしていくことは、これから重要なことですよね。
    ただ、そういった議論をするほどモデルやベイズの考え方が浸透しているのかなーという気もしますです。以前、統計解析は論文書くための通過儀礼だと思っている人はいまだ多くいるわけで、旧来の通過儀礼的統計解析っていうものに対して、統計モデルやベイズのフレームワークがどういう答を持っているかを多くの人に理解してもらうことの方が、優先順位が高い気がします。でないと、本当に”祭”で終わってしまうんではないか、と思うのですが。

  • > 統計解析は論文書くための通過儀礼だと思っている人はいまだ多くいるわけで

    おっしゃるとおりです.だから,道具としての統計モデルとか階層ベイズの位置づけをしっかりしないといけないわけです.従来の統計と階層ベイズが出す「答え」の違いを理解することも重要です.それと同時に,統計モデルがどういう考え(ここでは演繹推論的な考え)で問題を解こうとしているのかを理解することも不可欠でしょう.それらをあわせたうえで,統計モデルとか階層ベイズの位置づけをしっかり確立させていきたいものです.