Yoshi Nishikawa Blog

医学となにかのインタラクティブ

R package

RにJAGSを認識させた(rjagsがloadできないときの対処)

JAGS 解析でJAGSを使うことになった(OSはWindows 10)。 sourceforge.net JAGS: Just Another Gibbs Sampler 2021年10月11日時点の最新版はJAGS-4.3.0だ。 早速インストールする。 完了。 rjags R上で使うためにrjagsを使う。 インストールして、呼び出す i…

Rのggplot2で福島県南相馬市の地図を描く~もうすぐ野馬追

ggplot2で南相馬市の地図を描きたい 福島県南相馬市の方から相談を受け、Rの作図をしました。 こちらでは、南相馬市と、福島第一原子力発電所を地図上にプロットします。 パッケージは、 jpndistrict package | R Documentation sfとggplot2、geosphereで作…

Rで質問紙調査のサンプルサイズ計算を行う

今日は、質問紙調査でのサンプルサイズ計算をrで行います。 samplingbook を用います。 早速、関数からみていきましょう。 install.packages("samplesize") library(samplesize) sample.size.prop(e=, P=, N=, level=) Arguments e positive number specifyi…

WindowsでRstanをインストールした話~ Compilation ERROR の解決

Windows PCでrstanを使うべく、進めてみた、がうまくいかない。 compilation error その解決の備忘録として記しておく。 stan公式 RStan Getting Started (Japanese) · stan-dev/rstan Wiki · GitHub スペック Windows 10 64 bit R version 3.6.1 (2019-07-0…

Rで表記ゆれを癒やす:全角から半角へ

日本語データを扱うときに困ること 日本語データを分析するときにもっとも困ることは何でしょうか? それは、表記ゆれです。 送り仮名、漢字かな混じり、全角半角混じり、大文字小文字混じり・・・色々ありますが、 今回は、特に、全角と半角が混ざった表記…

【geom_sf()でエラー: 関数 "geom_sf" を見つけることができませんでした 】と言われ続ける運命に抗う

RでGISデータ解析を進めたくて、 ggplot2でsfデータを扱える、 geom_sf()関数を用いたい・・・ しかし、何度やっても geom_sf()でエラー: 関数 "geom_sf" を見つけることができませんでした というエラー表示が出てしまう・・・ というので悶々としていたの…

Rでダイアグラムを作成する

質的研究におけるCoding Tree library(data.tree) theme <- Node$new("テーマ") category1 <- theme$AddChild("あ") code1 <- category1$AddChild("い") code2 <- category1$AddChild("う") category2 <- theme$AddChild("AA") code3 <- category2$AddChild(…

評価者間信頼性(検者間信頼性) inter-rater reliabilityをRで算出する

IRRとは inter-rater reliability の略であり、 日本語では、評価者間信頼性となる。 評価者間信頼性 評価者間信頼性(検者間信頼性)は、2人以上の評価者が同じ対象を評価した場合の一致度です 評価者内信頼性 評価者内信頼性、検査者内信頼性は、同一評価…

RMarkdownで表を出力する

訳者の方からご恵贈頂いた、 Rプログラミング本格入門 第15章「生産性を高める」 より、とてもためになったので、自分なりに実践したことを記してみます。 動機 RMarkdownで出力したhtmlレポートに、キレイな表を入れたい。 やってみた carsをdata table型で…

Rを使って負の二項分布で回帰する Negative binomial regression

裾の長いカウントデータを扱いたい(外れ値が有る)ときに、負の二項分布を仮定したモデリングを考える。 MASS packageにはいっていたので、覚書として残しておく。 R: Fit a Negative Binomial Generalized Linear Model 以下で実行できる。 library(MASS) …

仮想通貨の勢力図をRを使って可視化する

今日は少し脱線して、仮想通貨情勢をRで調べてみる。 この記事を見ながら、自分で実装してみた。 今回、使うのは3つのパッケージ。 元記事にあったとおり、coinmarketcaprで仮想通貨のデータをとってきて、treemapで可視化。 米ドルではなく日本円で計算して…

CRANから消えた"Archived R package"をインストールしたい

質的研究に目覚めた朝。 論文を読んで、package "concord"をインストール! しようにもCRANの表舞台から削除されている。 そんな時、アーカイブされているpackageをインストールするのが、以下の方法。 *こちらを参考にしました。 # Download package tarbal…

Rを使って時系列データの変化点をみつける: changepoint

時系列データを扱う時に、変化点を見つけたいことがある。 Rにchangepointというパッケージがあるので、実装してみる。 1つのchangepointはdefaultのmethod = AMOCで良い。 複数のchangepointであれば、methodでPELT, SegNeighやBinSegを指定すれば良い。 #…

計量経済分析ことはじめ~時系列データを正しく扱う~

Rによる計量経済分析を読んだ。このシリーズはとても勉強になる。 書籍のHPはこちら キーワードと、キーとなるパッケージ・関数を列挙しておく。 時系列データを扱う時の問題点がわかりやすく解説されていて、よかった。 クロスセクションデータの回帰分析 …

tableone パッケージでtable1をつくる

臨床研究のtable1は 臨床系の研究で、図表を見ると、まず高確率で遭遇するtable1 八割がたこういう患者背景だ。 (リンク先が「図」表記になっているッ・・・!) これをいとも簡単に作成できるR packageがある。その名も・・・ tableone table1 = 表1だ。 …

記述統計に立ち返る

記述統計にはいつもsummaryを使っていたが、 summary(data) を利用していたが、psych パッケージの describe(data) mean, sd, median, range, se, (歪度: skewness)https://en.wikipedia.org/wiki/Skewness, (尖度: Kurtosis)https://en.wikipedia.org/wiki/…

ggplot2でグラフ作成 (3)

ggplot2 2016年に出版されたggplot2に関するHadley Wickhamによる著書。その名もggplot2、の続き。この本、最後まで読み解いて分かるが、本当におすすめ。データを扱うすべての人が読んだら良いと思う。 コンテンツ 大きく分けて3部で構成され、全12章にわか…

ggraphでグラフ作成

ggraph/README.md at master · thomasp85/ggraph · GitHub ggplot2 extensions: ggraph ggplotのextensionはこんなところにも。

Rで21世紀の相関係数を算出する(MIC)

相関 2変数とも連続データで,正規分布に従っているならばPearsonの相関係数を用いることができる。 少なくとも1変数が非連続データの時にはノンパラメトリック検定のSpearmanやKendallの相関係数を用いる。これらは、実データでなく、順位付け(大小関係)…

データ解析チートシート cheat sheet

チートシート R Studioのウェブサイトにまとまっており、 www.rstudio.com 以下のように様々なチートシートがある。 Data Wrangling with dplyr and tidyr Cheat Sheet Data Visualization with ggplot2 Cheat Sheet これは便利だ。

Network Meta-Analysisについて

Network Meta-Analysis (NMA) 従来のメタアナリシスの課題 従来のメタアナリシスでは、2つの治療についての比較しか得られない。例えばうつ病に対する薬剤には多くの種類があり、有効性・安全性・薬価は様々である。 そこで、利用可能なすべての薬剤につい…

GLMMを実装する

The glmmADMB package このパッケージを用いて、以下でinstallする。 install.packages("R2admb") install.packages("glmmADMB", repos=c("http://glmmadmb.r-forge.r-project.org/repos", getOption("repos")), type="source") これでzero inflationなどの…

circular statistics (角度統計)について

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 以前読んだ論文。前回はWaveletについて述べた。今日は、角度統計(circular statistic…

WaveletCompを使って気象データの周期性を解析する

WaveletComp 以前読んだ論文を参考に、WaveletCompを使ってみた。 気象データ www.data.jma.go.jp ここからA村のデータをとってくる。 A村のデータ 5年間の気温、降水量、風速のデータを取得。以下で実装。 library(WaveletComp) w.temp <- analyze.wavelet(…

髄膜炎のGlobal Trendに関する時系列データ解析論文

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 読んだ。 米プリンストン大学の研究者らからの報告。 髄膜炎の発症には、季節性があっ…

ggplot 2軸でプロットする

ggplot 美麗グラフが気に入っているのだが、そのままでは、左右で異なる軸を提示したいときにうまくいかない。 Rで解析:ggplot2の利便性が向上「plotflow」パッケージを参考にしたら、"plotflow"というパッケージを用いて二軸表示出来るようになった。 デー…

Hadley Wickhamアニキのこと

Hadley Wickhamアニキ 各所でR神と崇められているHadley Wickham(ハドリーウィッカム)アニキの存在を、つい最近知った。 そのきっかけは、使っているpackageが気づいたらHadley Wickhamアニキのものばかりだった。しかもdplyr, ggplot2など、欠かせないもの…

psych packageを用いた心理尺度開発・因子分析

尺度開発 尺度開発の手順 測定概念の決定 construct validity 項目作成content validity パイロット調査→微調整 本調査 各項目の基礎統計量確認 因子分析 factorial validity 信頼性係数の推定 criterion-related validity R Scree Plot psychというpackage…