Yoshi Nishikawa's Blog

〜医学・疫学・統計学編〜

R package

Rを使って負の二項分布で回帰する Negative binomial regression

裾の長いカウントデータを扱いたい(外れ値が有る)ときに、負の二項分布を仮定したモデリングを考える。 MASS packageにはいっていたので、覚書として残しておく。 R: Fit a Negative Binomial Generalized Linear Model 以下で実行できる。 library(MASS) …

仮想通貨の勢力図をRを使って可視化する

今日は少し脱線して、仮想通貨情勢をRで調べてみる。 この記事を見ながら、自分で実装してみた。 今回、使うのは3つのパッケージ。 元記事にあったとおり、coinmarketcaprで仮想通貨のデータをとってきて、treemapで可視化。 米ドルではなく日本円で計算して…

CRANから消えた"Archived R package"をインストールしたい

質的研究に目覚めた朝。 論文を読んで、package "concord"をインストール! しようにもCRANの表舞台から削除されている。 そんな時、アーカイブされているpackageをインストールするのが、以下の方法。 *こちらを参考にしました。 # Download package tarbal…

Rを使って時系列データの変化点をみつける: changepoint

時系列データを扱う時に、変化点を見つけたいことがある。 Rにchangepointというパッケージがあるので、実装してみる。 1つのchangepointはdefaultのmethod = AMOCで良い。 複数のchangepointであれば、methodでPELT, SegNeighやBinSegを指定すれば良い。 #…

計量経済分析ことはじめ~時系列データを正しく扱う~

Rによる計量経済分析を読んだ。このシリーズはとても勉強になる。 書籍のHPはこちら キーワードと、キーとなるパッケージ・関数を列挙しておく。 時系列データを扱う時の問題点がわかりやすく解説されていて、よかった。 クロスセクションデータの回帰分析 …

tableone パッケージでtable1をつくる

臨床研究のtable1は 臨床系の研究で、図表を見ると、まず高確率で遭遇するtable1 八割がたこういう患者背景だ。 (リンク先が「図」表記になっているッ・・・!) これをいとも簡単に作成できるR packageがある。その名も・・・ tableone table1 = 表1だ。 …

記述統計に立ち返る

記述統計にはいつもsummaryを使っていたが、 summary(data) を利用していたが、psych パッケージの describe(data) mean, sd, median, range, se, (歪度: skewness)https://en.wikipedia.org/wiki/Skewness, (尖度: Kurtosis)https://en.wikipedia.org/wiki/…

ggplot2でグラフ作成 (3)

ggplot2 2016年に出版されたggplot2に関するHadley Wickhamによる著書。その名もggplot2、の続き。この本、最後まで読み解いて分かるが、本当におすすめ。データを扱うすべての人が読んだら良いと思う。 コンテンツ 大きく分けて3部で構成され、全12章にわか…

ggraphでグラフ作成

ggraph/README.md at master · thomasp85/ggraph · GitHub ggplot2 extensions: ggraph ggplotのextensionはこんなところにも。

Rで21世紀の相関係数を算出する(MIC)

相関 2変数とも連続データで,正規分布に従っているならばPearsonの相関係数を用いることができる。 少なくとも1変数が非連続データの時にはノンパラメトリック検定のSpearmanやKendallの相関係数を用いる。これらは、実データでなく、順位付け(大小関係)…

データ解析チートシート cheat sheet

チートシート R Studioのウェブサイトにまとまっており、 www.rstudio.com 以下のように様々なチートシートがある。 Data Wrangling with dplyr and tidyr Cheat Sheet Data Visualization with ggplot2 Cheat Sheet これは便利だ。

Network Meta-Analysisについて

Network Meta-Analysis (NMA) 従来のメタアナリシスの課題 従来のメタアナリシスでは、2つの治療についての比較しか得られない。例えばうつ病に対する薬剤には多くの種類があり、有効性・安全性・薬価は様々である。 そこで、利用可能なすべての薬剤につい…

GLMMを実装する

The glmmADMB package このパッケージを用いて、以下でinstallする。 install.packages("R2admb") install.packages("glmmADMB", repos=c("http://glmmadmb.r-forge.r-project.org/repos", getOption("repos")), type="source") これでzero inflationなどの…

circular statistics (角度統計)について

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 以前読んだ論文。前回はWaveletについて述べた。今日は、角度統計(circular statistic…

WaveletCompを使って気象データの周期性を解析する

WaveletComp 以前読んだ論文を参考に、WaveletCompを使ってみた。 気象データ www.data.jma.go.jp ここからA村のデータをとってくる。 A村のデータ 5年間の気温、降水量、風速のデータを取得。以下で実装。 library(WaveletComp) w.temp <- analyze.wavelet(…

髄膜炎のGlobal Trendに関する時系列データ解析論文

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 読んだ。 米プリンストン大学の研究者らからの報告。 髄膜炎の発症には、季節性があっ…

ggplot 2軸でプロットする

ggplot 美麗グラフが気に入っているのだが、そのままでは、左右で異なる軸を提示したいときにうまくいかない。 Rで解析:ggplot2の利便性が向上「plotflow」パッケージを参考にしたら、"plotflow"というパッケージを用いて二軸表示出来るようになった。 デー…

Hadley Wickhamアニキのこと

Hadley Wickhamアニキ 各所でR神と崇められているHadley Wickham(ハドリーウィッカム)アニキの存在を、つい最近知った。 そのきっかけは、使っているpackageが気づいたらHadley Wickhamアニキのものばかりだった。しかもdplyr, ggplot2など、欠かせないもの…

psych packageを用いた心理尺度開発・因子分析

尺度開発 尺度開発の手順 測定概念の決定 construct validity 項目作成content validity パイロット調査→微調整 本調査 各項目の基礎統計量確認 因子分析 factorial validity 信頼性係数の推定 criterion-related validity R Scree Plot psychというpackage…