Yoshi Nishikawa's Blog

データと知識、その調和平均。

平均値の信頼区間とエラーバーの選定について [12章] [14章]

数学いらずの医科統計学

数学いらずの医科統計学 を読み解いている。
今日は 12章, 14章について。

CI of the mean (平均値のCI)

(Latexを使って以下、書いてみた。)
平均値のCIは、4つの値、サンプル平均、標準偏差、サンプルサイズ、信頼度により計算される。
$\ W=\frac{t^*s}{\sqrt{n}}$
ここで、$\frac{s}{\sqrt{n}}$は、standard error of the mean: SEM 標準誤差である。 なお、信頼区間は $[(m-W), (m+W)]$である。

なお、$n$サンプル数、$t^*$ t検定棄却値、$s$ 標準偏差、${m}$ 平均値である。

どのエラーバーをプロットするか。

値の変動を示したい時

平均値とSD。中央値とrange。中央値と四分位範囲。

平均値の正確さを示したい時

平均値とSEMや95%CI。t検定や分散分析など平均値の比較をする場合、データがモデル予測にどの程度近いか示す場合。

keywords

confidence interval
random sample
convinience sample
one-side confidence limit

体温問題

set.seed(1357)
n1<-130; m<-36.82; s<-0.41
res1<-rnorm(n1, m, s)
t.test(res1)
n2<-12
res2<-rnorm(n2, m, s)
boxplot(res1, res2)

f:id:yoshi_nishikawa:20160915105820p:plain

References

数学いらずの医科統計学
みんなのR -データ分析と統計解析の新しい教科書-
The R Tips―データ解析環境Rの基本技・グラフィックス活用集