Yoshi Nishikawa Blog

医学となにかのインタラクティブ

統計学

マルチレベルモデルの学習に良いウェブコンテンツ

Course topics | Centre for Multilevel Modelling | University of Bristol 地域研究などで多用される、「マルチレベルモデル」の学習には、このブリストル大学のウェブサイトが秀逸です。 登録すれば、無料で閲覧できます。

ベイズ統計分析によるデータモデリング入門 [ベイズ統計入門の決定版]

COI開示:特になし。 統計分析の教科書、データ分析の技術書、どんどん充実してきています。 でも、ベイズ統計モデリングを使いこなせていたでしょうか? 私の答えはNoでした。理由は、StanやBUGSといったベイズモデリングのためのコードを扱うハードルがあ…

Rを使って負の二項分布で回帰する Negative binomial regression

裾の長いカウントデータを扱いたい(外れ値が有る)ときに、負の二項分布を仮定したモデリングを考える。 MASS packageにはいっていたので、覚書として残しておく。 R: Fit a Negative Binomial Generalized Linear Model 以下で実行できる。 library(MASS) …

論文を書く際の統計的表現について

論文執筆の際、p値はどう記載するんですか? 有効数字は? 有意差なしはNSだけでよいですか? 0.05未満は<0.05でよいのですか? ・・・ このように聞かれたり、議論になったりすることがあるので、纏めておきます。 あくまで、一例ですが、Annals of Interna…

計量経済分析ことはじめ~時系列データを正しく扱う~

Rによる計量経済分析を読んだ。このシリーズはとても勉強になる。 書籍のHPはこちら キーワードと、キーとなるパッケージ・関数を列挙しておく。 時系列データを扱う時の問題点がわかりやすく解説されていて、よかった。 クロスセクションデータの回帰分析 …

分散分析についてANOVA(Analysis of Variance)

分散分析 数学いらずの医科統計学で、統計の概念的な理解を深めているのですが、 分散分析の理解については、以下の書籍や、リンクなどを参考に数式含めて再学習しました。 この東京大学出版会シリーズ、赤の統計学入門、緑の人文・社会科学の統計学と並んで…

記述統計に立ち返る

記述統計にはいつもsummaryを使っていたが、 summary(data) を利用していたが、psych パッケージの describe(data) mean, sd, median, range, se, (歪度: skewness)https://en.wikipedia.org/wiki/Skewness, (尖度: Kurtosis)https://en.wikipedia.org/wiki/…

ベイズ統計を学ぶ

ネット上にも、いろいろと教材が有るので、備忘録として載せておく。 Stan超初心者入門 階層モデルの分散パラメータの事前分布について 階層ベイズとWAIC Stanコードの書き方 中級編 Prior distributions for variance parameters in hierarchical models. A…

StanとRでベイズ統計モデリング

StanとRでベイズ統計モデリング (Wonderful R) 読んでいる。これは名著である。前半部分は、ベイズ統計関わらず、役立つ内容。とくに6章、モデリングの視点から確率分布に迫る箇所は、なかなかまとまったものがないので一見の価値あり。 1章 統計モデリング…

フォレストプロットを描く~JMP編

JMP JMPという統計ソフトを用いて学んだ。 www.jmp.com SAS社が開発したソフトウェア。 Forest plot 以下のページでforest plotというアドインを以下で取得。Rでいうpackageですね。 community.jmp.com 同ページ内においてあったRosaMeta.jmpで作成 同ページ…

MCMC

はじめての統計データ分析 「はじめての統計データ分析」 に関して覚書。 1章の記事はこちら。 2章のハイライト 1) MCMC(Markov chain Monte Carlo method)により事後分布のデータを用い、 2) MCMCには、Metropolis-Hasting method, Gibbs sampling methods,…

Rで21世紀の相関係数を算出する(MIC)

相関 2変数とも連続データで,正規分布に従っているならばPearsonの相関係数を用いることができる。 少なくとも1変数が非連続データの時にはノンパラメトリック検定のSpearmanやKendallの相関係数を用いる。これらは、実データでなく、順位付け(大小関係)…

GLMMを実装する

The glmmADMB package このパッケージを用いて、以下でinstallする。 install.packages("R2admb") install.packages("glmmADMB", repos=c("http://glmmadmb.r-forge.r-project.org/repos", getOption("repos")), type="source") これでzero inflationなどの…

circular statistics (角度統計)について

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 以前読んだ論文。前回はWaveletについて述べた。今日は、角度統計(circular statistic…

疫学・統計・Rなどの役立つリンク集 (Useful Links for Epidemiology, Statistics, R etc)

統計学 Statistics 統計学の学習(Learning statistics) Basics of Statistics (Jarkko Isotalo) 統計解析結果のレポーティング(Reporting statistical results) JJCO誌のガイドラインは1997年と古い物だが、有用。 日本語:福田治彦、大橋靖雄「Japanese Jou…

髄膜炎のGlobal Trendに関する時系列データ解析論文

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 読んだ。 米プリンストン大学の研究者らからの報告。 髄膜炎の発症には、季節性があっ…

標準化罹患比(SIR)と標準化死亡比(SMR)

SIRとSMR ある集団と、基準集団との疾病罹患・死亡の比較の指標について勉強してみた。 標準化罹患比 (SIR, Standardized Incidence Ratio) 人口構成の違いを除去して罹患率を比較するための指標。ある集団の罹患率が、基準となる集団と比べてどのくらい高い…

確率変数 [3章]

Rによる計算機統計学 Rによる計算機統計学を読み始めた。 英語の原書はこちら。 Rコードの例:R code examples この本の特徴は、文献を豊富に引用しており、学習に拡がりをもたせることが出来る。 ただ、Rを最低限扱える人でないと厳しいと思う。 逆変換 乱…

わたしの統計解析の学習

Rを愛している Rは、フリーソフトで、可能な計算は多岐にわたる。 他の統計ソフトも用いてみたが、 1. パッケージの多様性 2. 関連書物・文献の増加 3. 無料であること という絶大なメリットが有る。 逆に、唯一デメリットといえるのが、コードの習得だ。私…

平均値の信頼区間とエラーバーの選定について [12章] [14章]

数学いらずの医科統計学 数学いらずの医科統計学 を読み解いている。 今日は 12章, 14章について。 CI of the mean (平均値のCI) (Latexを使って以下、書いてみた。) 平均値のCIは、4つの値、サンプル平均、標準偏差、サンプルサイズ、信頼度により計算され…

数学解くガウス[回文] [10章]

数学いらずの医科統計学 数学いらずの医科統計学 を読み解いている。 今日は 10章「ガウス分布」について。 この名前、恥ずかしながら初めて知ったが、いわゆる正規分布のことらしい。 Key words Gaussian distribution; norm distribution: KarL Gaussが180…

サンプルの散らばりを評価する dispersion [9章]

数学いらずの医科統計学 数学いらずの医科統計学 を読み解いている。 今日は9章「散らばり」について。 「平均的な人間は1つの乳房と1つの精巣を備える。」 ーーーー統計学者 Des McHale 巻頭言から吹き出した。最高である。そして、「平均的な」議論だけ…