Yoshi Nishikawa Blog

医学となにかのインタラクティブ

R

RにJAGSを認識させた(rjagsがloadできないときの対処)

JAGS 解析でJAGSを使うことになった(OSはWindows 10)。 sourceforge.net JAGS: Just Another Gibbs Sampler 2021年10月11日時点の最新版はJAGS-4.3.0だ。 早速インストールする。 完了。 rjags R上で使うためにrjagsを使う。 インストールして、呼び出す i…

マルチレベルモデルの学習に良いウェブコンテンツ

Course topics | Centre for Multilevel Modelling | University of Bristol 地域研究などで多用される、「マルチレベルモデル」の学習には、このブリストル大学のウェブサイトが秀逸です。 登録すれば、無料で閲覧できます。

Rのggplot2で福島県南相馬市の地図を描く~もうすぐ野馬追

ggplot2で南相馬市の地図を描きたい 福島県南相馬市の方から相談を受け、Rの作図をしました。 こちらでは、南相馬市と、福島第一原子力発電所を地図上にプロットします。 パッケージは、 jpndistrict package | R Documentation sfとggplot2、geosphereで作…

Rで質問紙調査のサンプルサイズ計算を行う

今日は、質問紙調査でのサンプルサイズ計算をrで行います。 samplingbook を用います。 早速、関数からみていきましょう。 install.packages("samplesize") library(samplesize) sample.size.prop(e=, P=, N=, level=) Arguments e positive number specifyi…

WindowsでRstanをインストールした話~ Compilation ERROR の解決

Windows PCでrstanを使うべく、進めてみた、がうまくいかない。 compilation error その解決の備忘録として記しておく。 stan公式 RStan Getting Started (Japanese) · stan-dev/rstan Wiki · GitHub スペック Windows 10 64 bit R version 3.6.1 (2019-07-0…

ベイズ統計分析によるデータモデリング入門 [ベイズ統計入門の決定版]

COI開示:特になし。 統計分析の教科書、データ分析の技術書、どんどん充実してきています。 でも、ベイズ統計モデリングを使いこなせていたでしょうか? 私の答えはNoでした。理由は、StanやBUGSといったベイズモデリングのためのコードを扱うハードルがあ…

Rで表記ゆれを癒やす:全角から半角へ

日本語データを扱うときに困ること 日本語データを分析するときにもっとも困ることは何でしょうか? それは、表記ゆれです。 送り仮名、漢字かな混じり、全角半角混じり、大文字小文字混じり・・・色々ありますが、 今回は、特に、全角と半角が混ざった表記…

Rで可視化する:可視化の方法とは

手持ちのデータを可視化する データの特徴を示すためには、グラフや図にすることが重要である。 いくつも可視化があるのだが、実際にそれぞれのグラフを作成するには、 データの性質を知る 可視化を実装する (実装の仕方を調べるために可視化の名称を知る) …

Rでcsvファイルを出力する

Rでcsvファイルに出力したい。 write.csv(hoge, file = "test.csv") エクセルで開くことが出来るように、文字コードを指定する。 Microsoftコードページ932 - Wikipedia write.csv(hoge, file = "test.csv", fileEncoding = "CP932")

Rの出力結果欄の表示幅を変えたい

tableoneを用いて、2群比較の結果をRで出力したのに、上段に1群、下段に1群の並びになってしまう。 これは、出力欄の表示列数が原因。 options(max.print="99999",width="300") #widthは出力結果欄の表示列数 これで解決。 2群比較は左右に並びます。

Bipartite Graph 2部グラフを描く

2部グラフを作成するため、type情報のTRUE/ FALSEを入力したい。 igraphのbipartite mappingを使うと良い。 g <- graph_from_data_frame(data, directed=TRUE) E(g)$weight <- data$N #重みづけ V(g)$type <- bipartite.mapping(g)$type #type情報を入れる

igraphを使って、データフレームから隣接行列を得る

column1=起点のnode、clumn2=終点のnode、column3=重み、のようなデータフレームがあって、隣接行列を得た。 まず、igraphデータに変換する。 g <- graph_from_data_frame(data, directed=TRUE) E(g)$weight <- data$data[,3] #重み 以下で隣接行列を取り出…

Network Science をまなぶ

Network Science networksciencebook.com この本を読みながら勉強していきます! 参考資料 R+igraph - Kazuhiro Takemoto グラフ・ネットワーク分析で遊ぶ(1):グラフ可視化・描画手法 - 六本木で働くデータサイエンティストのブログ グラフ・ネットワーク分…

【geom_sf()でエラー: 関数 "geom_sf" を見つけることができませんでした 】と言われ続ける運命に抗う

RでGISデータ解析を進めたくて、 ggplot2でsfデータを扱える、 geom_sf()関数を用いたい・・・ しかし、何度やっても geom_sf()でエラー: 関数 "geom_sf" を見つけることができませんでした というエラー表示が出てしまう・・・ というので悶々としていたの…

Rでダイアグラムを作成する

質的研究におけるCoding Tree library(data.tree) theme <- Node$new("テーマ") category1 <- theme$AddChild("あ") code1 <- category1$AddChild("い") code2 <- category1$AddChild("う") category2 <- theme$AddChild("AA") code3 <- category2$AddChild(…

評価者間信頼性(検者間信頼性) inter-rater reliabilityをRで算出する

IRRとは inter-rater reliability の略であり、 日本語では、評価者間信頼性となる。 評価者間信頼性 評価者間信頼性(検者間信頼性)は、2人以上の評価者が同じ対象を評価した場合の一致度です 評価者内信頼性 評価者内信頼性、検査者内信頼性は、同一評価…

RMarkdownで表を出力する

訳者の方からご恵贈頂いた、 Rプログラミング本格入門 第15章「生産性を高める」 より、とてもためになったので、自分なりに実践したことを記してみます。 動機 RMarkdownで出力したhtmlレポートに、キレイな表を入れたい。 やってみた carsをdata table型で…

Rを使って負の二項分布で回帰する Negative binomial regression

裾の長いカウントデータを扱いたい(外れ値が有る)ときに、負の二項分布を仮定したモデリングを考える。 MASS packageにはいっていたので、覚書として残しておく。 R: Fit a Negative Binomial Generalized Linear Model 以下で実行できる。 library(MASS) …

仮想通貨の勢力図をRを使って可視化する

今日は少し脱線して、仮想通貨情勢をRで調べてみる。 この記事を見ながら、自分で実装してみた。 今回、使うのは3つのパッケージ。 元記事にあったとおり、coinmarketcaprで仮想通貨のデータをとってきて、treemapで可視化。 米ドルではなく日本円で計算して…

CRANから消えた"Archived R package"をインストールしたい

質的研究に目覚めた朝。 論文を読んで、package "concord"をインストール! しようにもCRANの表舞台から削除されている。 そんな時、アーカイブされているpackageをインストールするのが、以下の方法。 *こちらを参考にしました。 # Download package tarbal…

Rを使って時系列データの変化点をみつける: changepoint

時系列データを扱う時に、変化点を見つけたいことがある。 Rにchangepointというパッケージがあるので、実装してみる。 1つのchangepointはdefaultのmethod = AMOCで良い。 複数のchangepointであれば、methodでPELT, SegNeighやBinSegを指定すれば良い。 #…

計量経済分析ことはじめ~時系列データを正しく扱う~

Rによる計量経済分析を読んだ。このシリーズはとても勉強になる。 書籍のHPはこちら キーワードと、キーとなるパッケージ・関数を列挙しておく。 時系列データを扱う時の問題点がわかりやすく解説されていて、よかった。 クロスセクションデータの回帰分析 …

効率的なR運用を目指して

Rの基礎とプログラミング技法 Rの基礎とプログラミング技法に、Rを効率よく扱うコツについて非常にわかりやすく載っていたので、トライしてみた。 第5章:効率的なプログラミング apply applyは、 ベクトル単位で処理できる lapplyはリストやデータフレーム…

R markdownのknitr::opts_chunk設定をどうしているか。

忘備録的に。 私は、基本はこのスタイルで、 figureの縦横比が一致するようにしている。 tidyverseが静かに発動するようにしている。 knitr::opts_chunk$set(echo = TRUE, out.width = 480, out.height = 480, fig.width = 7,fig.height = 7) library(tidyve…

tableone パッケージでtable1をつくる

臨床研究のtable1は 臨床系の研究で、図表を見ると、まず高確率で遭遇するtable1 八割がたこういう患者背景だ。 (リンク先が「図」表記になっているッ・・・!) これをいとも簡単に作成できるR packageがある。その名も・・・ tableone table1 = 表1だ。 …

ggplot2で平均値の推移をプロットする

http://nfunao.web.fc2.com/files/sgplot_vs_ggplot2.pdf http://nfunao.web.fc2.com/files/R-ggplot2.pdf CRAN - Package doBy このあたりが参考になる。 ちなみに、 package “gplot"には、plotmeansという便利関数がある。

NAのある行を削除する

ある変数hogeの中に、NA(欠測値)があり、それを含む行だけを削除したい時。 data[complete.cases(data$hoge), ] でOK。

記述統計に立ち返る

記述統計にはいつもsummaryを使っていたが、 summary(data) を利用していたが、psych パッケージの describe(data) mean, sd, median, range, se, (歪度: skewness)https://en.wikipedia.org/wiki/Skewness, (尖度: Kurtosis)https://en.wikipedia.org/wiki/…

ベイズ統計を学ぶ

ネット上にも、いろいろと教材が有るので、備忘録として載せておく。 Stan超初心者入門 階層モデルの分散パラメータの事前分布について 階層ベイズとWAIC Stanコードの書き方 中級編 Prior distributions for variance parameters in hierarchical models. A…

StanとRでベイズ統計モデリング

StanとRでベイズ統計モデリング (Wonderful R) 読んでいる。これは名著である。前半部分は、ベイズ統計関わらず、役立つ内容。とくに6章、モデリングの視点から確率分布に迫る箇所は、なかなかまとまったものがないので一見の価値あり。 1章 統計モデリング…