Yoshi Nishikawa's Blog

〜医学・疫学・統計学編〜

論文を書く際の統計的表現について

論文執筆の際、p値はどう記載するんですか? 有効数字は? 有意差なしはNSだけでよいですか? 0.05未満は<0.05でよいのですか? ・・・ このように聞かれたり、議論になったりすることがあるので、纏めておきます。 あくまで、一例ですが、Annals of Interna…

Rを使って時系列データの変化点をみつける: changepoint

時系列データを扱う時に、変化点を見つけたいことがある。 Rにchangepointというパッケージがあるので、実装してみる。 1つのchangepointはdefaultのmethod = AMOCで良い。 複数のchangepointであれば、methodでPELT, SegNeighやBinSegを指定すれば良い。 #…

計量経済分析ことはじめ~時系列データを正しく扱う~

Rによる計量経済分析を読んだ。このシリーズはとても勉強になる。 書籍のHPはこちら キーワードと、キーとなるパッケージ・関数を列挙しておく。 時系列データを扱う時の問題点がわかりやすく解説されていて、よかった。 クロスセクションデータの回帰分析 …

効率的なR運用を目指して

Rの基礎とプログラミング技法 Rの基礎とプログラミング技法に、Rを効率よく扱うコツについて非常にわかりやすく載っていたので、トライしてみた。 第5章:効率的なプログラミング apply applyは、 ベクトル単位で処理できる lapplyはリストやデータフレーム…

分散分析についてANOVA(Analysis of Variance)

分散分析 数学いらずの医科統計学で、統計の概念的な理解を深めているのですが、 分散分析の理解については、以下の書籍や、リンクなどを参考に数式含めて再学習しました。 この東京大学出版会シリーズ、赤の統計学入門、緑の人文・社会科学の統計学と並んで…

Clinical Pictureを投稿する

前回、レターを投稿するで好評いただいたので、clinical pictureに関しても纏めておきます。これは2017年10月3日時点での情報です。 投稿先あれこれ NEJM Please include a title for your submission. The title should contain no more than eight words. …

macでzipをlockする

macでzipをlockする方法について覚書。 terminalでzipcloak <zipファイル名>を入力し、passを入れるだけ。以下を参考にしました。 www.atmarkit.co.jp

R markdownのknitr::opts_chunk設定をどうしているか。

忘備録的に。 私は、基本はこのスタイルで、 figureの縦横比が一致するようにしている。 tidyverseが静かに発動するようにしている。 knitr::opts_chunk$set(echo = TRUE, out.width = 480, out.height = 480, fig.width = 7,fig.height = 7) library(tidyve…

レターを投稿する

レターとは いわゆるレターとは、簡単に言うと、読者の投稿欄へのお手紙です。論文を読んで浮かんだ疑問点について著者へ問い合わせ、議論します。 critical appraisal (批判的吟味)の力を養うことが出来ます。 たかがレター、とも言われますが、されどレタ…

これならわかる応用数学教室

読んだ。非常にわかりやすく記されていておすすめ。 最小二乗法 直行関数展開 フーリエ解析 離散フーリエ解析 固有値問題と2次形式 主軸変換とその応用 ウェーブレット解析 とにかく統計や計算機科学に関わる、(かつ、理解したい)人は、全員読んでおくと良…

tableone パッケージでtable1をつくる

臨床研究のtable1は 臨床系の研究で、図表を見ると、まず高確率で遭遇するtable1 八割がたこういう患者背景だ。 (リンク先が「図」表記になっているッ・・・!) これをいとも簡単に作成できるR packageがある。その名も・・・ tableone table1 = 表1だ。 …

AGREEII~ガイドライン評価のためのガイドライン

equator network The EQUATOR Network | Enhancing the QUAlity and Transparency Of Health Researchには、数々の論文執筆のためのガイドラインが載せられている。 AGREEII ガイドライン評価にもAGREEII (Appraisal of Guidelines for Research&Evaluation…

公共財はどのあたりが公共なのか

「今、僕は、とある山間部で仕事をしている。 朝、部屋で起きて、ご飯を食べて、コーヒーで一息入れる。 車にのり、道路を通って職場へと出かける。 或いは、公園の前を自転車で通って行っても良いかもしれない。 山の空気は澄んでいて、美味しい。」 あらゆ…

ggplot2で平均値の推移をプロットする

http://nfunao.web.fc2.com/files/sgplot_vs_ggplot2.pdf http://nfunao.web.fc2.com/files/R-ggplot2.pdf CRAN - Package doBy このあたりが参考になる。 ちなみに、 package “gplot"には、plotmeansという便利関数がある。

Deep Learningことはじめ

読んだ。 これ一冊でDeep Lerningの理解は事足りる。とにかくわかりやすく記述されている。 1章 Python入門 1.1 Pythonとは 1.2 Pythonのインストール 1.3 Pythonインタプリタ 1.4 Pythonスクリプトファイル 1.5 NumPy 1.6 Matplotlib 1.7 まとめ 2章 パーセ…

査読に関して

staff.aist.go.jp このサイトは役に立ちそうだ。

ゲーム理論ことはじめ

まずは1-3章を読んだ。 ナッシュ均衡 相手が戦略を変えない限り、自分に戦略を変えるメリットがない戦略の組み合わせ 両性の戦い チキンゲーム 囚人のジレンマゲーム パレート最適 他者を犠牲にすることなく厚生を改善する余地が、誰にとってもなくなってい…

NAのある行を削除する

ある変数hogeの中に、NA(欠測値)があり、それを含む行だけを削除したい時。 data[complete.cases(data$hoge), ] でOK。

記述統計に立ち返る

記述統計にはいつもsummaryを使っていたが、 summary(data) を利用していたが、psych パッケージの describe(data) mean, sd, median, range, se, (歪度: skewness)https://en.wikipedia.org/wiki/Skewness, (尖度: Kurtosis)https://en.wikipedia.org/wiki/…

施設に関するCase studyを記す

Developing a methodological framework for organisational case studies: a rapid review and consensus development process | The EQUATOR Network 読んだ。 Case studyもヘルスサービスリサーチとして、研究のガイドラインが存在する。 本編はこちら チ…

Content analysisことはじめ

読んだ。意訳だが、各項目を列挙しておく。 歴史 その概念形成 その利用と推論 内容分析のロジック 利用 サンプリング 記録・コーディング データ言語 分析の構成 分析の代表的手法 コンピューターによる補助 信頼性 妥当性 実践ガイド 内容分析の歴史は古く…

ベイズ統計を学ぶ

ネット上にも、いろいろと教材が有るので、備忘録として載せておく。 Stan超初心者入門 階層モデルの分散パラメータの事前分布について 階層ベイズとWAIC Stanコードの書き方 中級編 Prior distributions for variance parameters in hierarchical models. A…

StanとRでベイズ統計モデリング

StanとRでベイズ統計モデリング (Wonderful R) 読んでいる。これは名著である。前半部分は、ベイズ統計関わらず、役立つ内容。とくに6章、モデリングの視点から確率分布に迫る箇所は、なかなかまとまったものがないので一見の価値あり。 1章 統計モデリング…

insetのある地図を作りたい

ArcGISでinsetのある地図を作る方法に関しては、ここで解説されている。 insetを入れるたびに探しているので、ここにリンクを貼り付けておく。 desktop.arcgis.com プレビュー画面と行き来しながら見ると良い。

csvファイルの読み込み

元データから読み込む際に、高頻度で出現する(していた)R上のエラー。対応策を備忘録として残しておく。 読み込みたいcsvを「UTF-8」形式にしておく。 私はmiというエディタを用いている。 “as.is=T"を入れる 文字列、数値が混在していてもOK。もし、数値…

5-FUによる高アンモニア血症では、異化産物のFBALとFMAが蓄積

5-FUによる高アンモニア血症の5-FU代謝物血中濃度分析論文についての解説記事 わたしたちのチームの研究で、5-FUによる高アンモニア血症を来した時にフルオロ・ベータ・アラニン(FBAL)とモノフルオロ酢酸(FMA)という異化産物の血中濃度が上昇していることが…

フォレストプロットを描く~JMP編

JMP JMPという統計ソフトを用いて学んだ。 www.jmp.com SAS社が開発したソフトウェア。 Forest plot 以下のページでforest plotというアドインを以下で取得。Rでいうpackageですね。 community.jmp.com 同ページ内においてあったRosaMeta.jmpで作成 同ページ…

Epidemiology and the Delivery of Health Care Services: Methods and Applications

ざっと読んだ。 PART1 1. An Epidemiologic Framework for the Delivery of Health Care Services 2. Measurement Issues in the Use of Epidemiologic Data 3. Descriptive Epidemiological Methods 4. Epidemiological Study Designs for Evaluating Healt…

ggplot2でグラフ作成 (3)

ggplot2 2016年に出版されたggplot2に関するHadley Wickhamによる著書。その名もggplot2、の続き。この本、最後まで読み解いて分かるが、本当におすすめ。データを扱うすべての人が読んだら良いと思う。 コンテンツ 大きく分けて3部で構成され、全12章にわか…

MCMC

はじめての統計データ分析 「はじめての統計データ分析」 に関して覚書。 1章の記事はこちら。 2章のハイライト 1) MCMC(Markov chain Monte Carlo method)により事後分布のデータを用い、 2) MCMCには、Metropolis-Hasting method, Gibbs sampling methods,…