Yoshi Nishikawa's Blog

〜医学・疫学・統計学編〜

ゲーム理論ことはじめ

まずは1-3章を読んだ。

  • ナッシュ均衡
    相手が戦略を変えない限り、自分に戦略を変えるメリットがない戦略の組み合わせ

  • 両性の戦い

  • キンゲーム

  • 囚人のジレンマゲーム

  • パレート最適 他者を犠牲にすることなく厚生を改善する余地が、誰にとってもなくなっている組み合わせ

  • 支配戦略
    ある片方の必勝選択肢がある。

  • 戦略型と展開型
    戦略型は表形式。展開型は樹形図。

以下で戦略型をRで実装することが出来る。
statrstart.github.io

NAのある行を削除する

ある変数hogeの中に、NA(欠測値)があり、それを含む行だけを削除したい時。

data[complete.cases(data$hoge), ] 

でOK。

記述統計に立ち返る

記述統計にはいつもsummaryを使っていたが、

summary(data)

を利用していたが、psych パッケージの

describe(data)

mean, sd, median, range, se, (歪度: skewness)https://en.wikipedia.org/wiki/Skewness, (尖度: Kurtosis)https://en.wikipedia.org/wiki/Kurtosisまで一度に表示できて便利。

施設に関するCase studyを記す

Developing a methodological framework for organisational case studies: a rapid review and consensus development process | The EQUATOR Network

読んだ。

Case studyもヘルスサービスリサーチとして、研究のガイドラインが存在する。

本編はこちら

チェックリスト(英語)

デザインに関する記述

  1. case studyであることを明記
  2. 広い意味での目的
  3. リサーチクエスチョンとそれに対する仮説
  4. caseとその選択理由

データ収集に関しての記述

  1. どのようにデータは集められたか
  2. 用いられたエビデンスのソースについて
  3. 倫理的配慮や同意取得、アクセス権や許可について

データ分析について

  1. 分析方法に関する記述

結果の解釈

  1. 内在する欠点と其の影響
  2. 方法論の適切さ・質的研究の適切さについて
  3. データ分析結果に関する議論
  4. 主張が適切かどうか
  5. 研究に関する注意事項

Content analysisことはじめ

読んだ。意訳だが、各項目を列挙しておく。

  1. 歴史
  2. その概念形成
  3. その利用と推論
  4. 内容分析のロジック
  5. 利用
  6. サンプリング
  7. 記録・コーディング
  8. データ言語
  9. 分析の構成
  10. 分析の代表的手法
  11. コンピューターによる補助
  12. 信頼性
  13. 妥当性
  14. 実践ガイド

内容分析の歴史は古く、1900年代初頭から、社会学者が新聞の内容分析など政治経済関連の研究をおこなっていた。第二次世界大戦後、Berelsonらにより概念が広げられた。質的研究の範疇には位置づけられるが、サンプルを集めて頻度を議論したり、クラスタリングしたり、量的研究とも親和性が高そう。

掘り下げた臨床研究を行う上でも有用そうな手法である。

ベイズ統計を学ぶ

ネット上にも、いろいろと教材が有るので、備忘録として載せておく。

Stan超初心者入門

階層モデルの分散パラメータの事前分布について

階層ベイズとWAIC

Stanコードの書き方 中級編

Prior distributions for variance parameters in hierarchical models. Andrew Gelman 2006

StanとRでベイズ統計モデリング

StanとRでベイズ統計モデリング (Wonderful R)

読んでいる。これは名著である。前半部分は、ベイズ統計関わらず、役立つ内容。とくに6章、モデリングの視点から確率分布に迫る箇所は、なかなかまとまったものがないので一見の価値あり。

1章 統計モデリングとStanの概要

2章 ベイズ推定

maximum likelihood estimation
log likelihood

3章 統計モデリングを始める前に

統計モデリングの手順:
解析の目的
データ分布の確認
メカニズムの想像
モデル式の記述
Rでシュミレーション
Stanで実装
推定結果の解釈

4章 StanとRStanをはじめよう

chains: Stan開発チームは4を推奨
iter: 試行錯誤中は500-1000程度。最後は1000-5000程度
warmup: traceplotを見て決める。100-500で十分なことが多い
this: 通常1で施行

並列化なしでうまくいくことを確認してから並列化する。

5章 基本的な回帰

重回帰
二項ロジスティック回帰
ロジスティック回帰
ポアソン回帰

6章 統計モデリングの視点から確率分布の紹介

一様分布
ベルヌーイ分布
二項分布
ベータ分布
カテゴリカル分布
多項分布
ディリクレ分布
指数分布
ポアソン分布
ガンマ分布
正規分布
対数正規分布
多変量正規分布
コーシー分布
Studentのt分布
ラプラス分布

7章以降は、すこし発展的な内容。