Yoshi Nishikawa's Blog

データと知識、その調和平均。

レターを投稿する

レターとは いわゆるレターとは、簡単に言うと、読者の投稿欄へのお手紙です。論文を読んで浮かんだ疑問点について著者へ問い合わせ、議論します。 critical appraisal (批判的吟味)の力を養うことが出来ます。 たかがレター、とも言われますが、されどレタ…

これならわかる応用数学教室

読んだ。非常にわかりやすく記されていておすすめ。 最小二乗法 直行関数展開 フーリエ解析 離散フーリエ解析 固有値問題と2次形式 主軸変換とその応用 ウェーブレット解析 とにかく統計や計算機科学に関わる、(かつ、理解したい)人は、全員読んでおくと良…

tableone パッケージでtable1をつくる

臨床研究のtable1は 臨床系の研究で、図表を見ると、まず高確率で遭遇するtable1 八割がたこういう患者背景だ。 (リンク先が「図」表記になっているッ・・・!) これをいとも簡単に作成できるR packageがある。その名も・・・ tableone table1 = 表1だ。 …

AGREEII~ガイドライン評価のためのガイドライン

equator network The EQUATOR Network | Enhancing the QUAlity and Transparency Of Health Researchには、数々の論文執筆のためのガイドラインが載せられている。 AGREEII ガイドライン評価にもAGREEII (Appraisal of Guidelines for Research&Evaluation…

公共財はどのあたりが公共なのか

「今、僕は、とある山間部で仕事をしている。 朝、部屋で起きて、ご飯を食べて、コーヒーで一息入れる。 車にのり、道路を通って職場へと出かける。 或いは、公園の前を自転車で通って行っても良いかもしれない。 山の空気は澄んでいて、美味しい。」 あらゆ…

ggplot2で平均値の推移をプロットする

http://nfunao.web.fc2.com/files/sgplot_vs_ggplot2.pdf http://nfunao.web.fc2.com/files/R-ggplot2.pdf CRAN - Package doBy このあたりが参考になる。 ちなみに、 package “gplot"には、plotmeansという便利関数がある。

Deep Learningことはじめ

読んだ。 これ一冊でDeep Lerningの理解は事足りる。とにかくわかりやすく記述されている。 1章 Python入門 1.1 Pythonとは 1.2 Pythonのインストール 1.3 Pythonインタプリタ 1.4 Pythonスクリプトファイル 1.5 NumPy 1.6 Matplotlib 1.7 まとめ 2章 パーセ…

査読に関して

staff.aist.go.jp このサイトは役に立ちそうだ。

ゲーム理論ことはじめ

まずは1-3章を読んだ。 ナッシュ均衡 相手が戦略を変えない限り、自分に戦略を変えるメリットがない戦略の組み合わせ 両性の戦い チキンゲーム 囚人のジレンマゲーム パレート最適 他者を犠牲にすることなく厚生を改善する余地が、誰にとってもなくなってい…

NAのある行を削除する

ある変数hogeの中に、NA(欠測値)があり、それを含む行だけを削除したい時。 data[complete.cases(data$hoge), ] でOK。

記述統計に立ち返る

記述統計にはいつもsummaryを使っていたが、 summary(data) を利用していたが、psych パッケージの describe(data) mean, sd, median, range, se, (歪度: skewness)https://en.wikipedia.org/wiki/Skewness, (尖度: Kurtosis)https://en.wikipedia.org/wiki/…

施設に関するCase studyを記す

Developing a methodological framework for organisational case studies: a rapid review and consensus development process | The EQUATOR Network 読んだ。 Case studyもヘルスサービスリサーチとして、研究のガイドラインが存在する。 本編はこちら チ…

Content analysisことはじめ

読んだ。意訳だが、各項目を列挙しておく。 歴史 その概念形成 その利用と推論 内容分析のロジック 利用 サンプリング 記録・コーディング データ言語 分析の構成 分析の代表的手法 コンピューターによる補助 信頼性 妥当性 実践ガイド 内容分析の歴史は古く…

ベイズ統計を学ぶ

ネット上にも、いろいろと教材が有るので、備忘録として載せておく。 Stan超初心者入門 階層モデルの分散パラメータの事前分布について 階層ベイズとWAIC Stanコードの書き方 中級編 Prior distributions for variance parameters in hierarchical models. A…

StanとRでベイズ統計モデリング

StanとRでベイズ統計モデリング (Wonderful R) 読んでいる。これは名著である。前半部分は、ベイズ統計関わらず、役立つ内容。とくに6章、モデリングの視点から確率分布に迫る箇所は、なかなかまとまったものがないので一見の価値あり。 1章 統計モデリング…

insetのある地図を作りたい

ArcGISでinsetのある地図を作る方法に関しては、ここで解説されている。 insetを入れるたびに探しているので、ここにリンクを貼り付けておく。 desktop.arcgis.com プレビュー画面と行き来しながら見ると良い。

csvファイルの読み込み

元データから読み込む際に、高頻度で出現する(していた)R上のエラー。対応策を備忘録として残しておく。 読み込みたいcsvを「UTF-8」形式にしておく。 私はmiというエディタを用いている。 “as.is=T"を入れる 文字列、数値が混在していてもOK。もし、数値…

5-フルオロウラシルによる高アンモニア血症では、異化産物のFBALとFMAが蓄積

抗がん薬5-FUで時々起こる「高アンモニア血症」を起こした症例の5-FU代謝物の血中濃度分析に関する論文の解説記事です。1990年代から仮説として提唱されていたことを実データとともに示しました。

フォレストプロットを描く~JMP編

JMP JMPという統計ソフトを用いて学んだ。 www.jmp.com SAS社が開発したソフトウェア。 Forest plot 以下のページでforest plotというアドインを以下で取得。Rでいうpackageですね。 community.jmp.com 同ページ内においてあったRosaMeta.jmpで作成 同ページ…

Epidemiology and the Delivery of Health Care Services: Methods and Applications

ざっと読んだ。 PART1 1. An Epidemiologic Framework for the Delivery of Health Care Services 2. Measurement Issues in the Use of Epidemiologic Data 3. Descriptive Epidemiological Methods 4. Epidemiological Study Designs for Evaluating Healt…

ggplot2でグラフ作成 (3)

ggplot2 2016年に出版されたggplot2に関するHadley Wickhamによる著書。その名もggplot2、の続き。この本、最後まで読み解いて分かるが、本当におすすめ。データを扱うすべての人が読んだら良いと思う。 コンテンツ 大きく分けて3部で構成され、全12章にわか…

MCMC

はじめての統計データ分析 「はじめての統計データ分析」 に関して覚書。 1章の記事はこちら。 2章のハイライト 1) MCMC(Markov chain Monte Carlo method)により事後分布のデータを用い、 2) MCMCには、Metropolis-Hasting method, Gibbs sampling methods,…

survival aNalysis ~no no R more~

(またおっさんホイホイなタイトルをつけてしまった) ggplot2でsurvival analysisのプロットをしたいときは、 GGally パッケージに含まれる、ggsurv関数がある。 https://cran.r-project.org/web/packages/GGally/GGally.pdf 自分でggsurv関数を入れ込みた…

Pubmedで文献検索

文献検索には型がある ネット上で色々と教材が有るので、貼り付けておきます。 音羽病院廣江先生 20170424_PubMedの使い方@洛和会音羽病院 東京大学図書館 http://www.lib.m.u-tokyo.ac.jp/manual/pubmedmanual.pdf 慶應大学図書館 http://www.med.lib.keio.…

グラフ理論

読んだ。 1章 グラフの基礎 2章 最小全域木 3章 最短経路問題 4章 オイラー回路とハミルトン閉路 5章 グラフの彩色 6章 最大流問題 7章 マッチング グラフ理論の入門編としておすすめできる。 私が入門編の書物に求める要素 1. 読みやすい 具体例とともに簡…

ggraphでグラフ作成

ggraph/README.md at master · thomasp85/ggraph · GitHub ggplot2 extensions: ggraph ggplotのextensionはこんなところにも。

大腸がんスクリーニング (Colorectal Cancer Screening)

Colorectal Cancer Screening に関する書籍をざっと読んだ。大腸がんのスクリーニングが焦点。分子生物学的な観点も含めて記述してあって知識の確認になった。 Colorectal Cancer Pathways Petr Protiva Risk Factors and Screening for Colorectal Cancer J…

Rで21世紀の相関係数を算出する(MIC)

相関 2変数とも連続データで,正規分布に従っているならばPearsonの相関係数を用いることができる。 少なくとも1変数が非連続データの時にはノンパラメトリック検定のSpearmanやKendallの相関係数を用いる。これらは、実データでなく、順位付け(大小関係)…

データ解析チートシート cheat sheet

チートシート R Studioのウェブサイトにまとまっており、 www.rstudio.com 以下のように様々なチートシートがある。 Data Wrangling with dplyr and tidyr Cheat Sheet Data Visualization with ggplot2 Cheat Sheet これは便利だ。

Network Meta-Analysisについて

Network Meta-Analysis (NMA) 従来のメタアナリシスの課題 従来のメタアナリシスでは、2つの治療についての比較しか得られない。例えばうつ病に対する薬剤には多くの種類があり、有効性・安全性・薬価は様々である。 そこで、利用可能なすべての薬剤につい…

ポリファーマシー(Polypharmacy) [介護施設編]

ポリファーマシー(Polypharmacy)とは 単純に「4~6種類以上の薬を飲んでいる状態」をさすこともあるが、問題になるのは、不適切な多剤併用である。 これを受けて、Polypharmacyとは、往々にして「必要以上に薬を飲んでいて、薬による有害事象が起こっている…

可視セルのみをコピーする、隠れたA列を表示する

可視セルのみをコピーする ・Windows → 「Alt+;(セミコロン)」 ・Mac → 「shift + command + Z」 のショートカットキーで選択して貼り付ければOKです。 A列が表示されない場合 隠れたA列を表示するには、B列から左にドラッグして 2C と表示されてからマ…

qplotで日本語を使う

ggplotを手軽に ggplotのコードが覚えられない、忘れる。 何故かエラーになる、そんなことはありませんか? ggplotを手軽に行うための関数があります。 その名も、qplot(quickplot) qplot qplot. ggplot2 2.1.0 ここを参考に色々な事ができる。 plot関数に近…

GLMMを実装する

The glmmADMB package このパッケージを用いて、以下でinstallする。 install.packages("R2admb") install.packages("glmmADMB", repos=c("http://glmmadmb.r-forge.r-project.org/repos", getOption("repos")), type="source") これでzero inflationなどの…

google mapを用いてある地点のシェープファイルを生成する

シェープファイル(Shapefile)とは シェープファイル(Shapefile)とは、Esri 社の提唱したベクトル形式の業界標準フォーマットです。Esri 製品はもちろん、多くの GIS ソフトウェアで利用が可能です。シェープファイルは仕様が公開されています。シェープフ…

Mac bookのbootcampで起動したwindowsでスクリーンショットを撮る

ブートキャンプのウィンドウズでスクリーンショット Windowsをブートキャンプで起動することがあります。 私の場合、ArcGISを使う場合がほとんどです。 以下のサイトを参考にしました。 www.webantena.net 主に3つの方法があります。 osk (スクリーンキーボ…

UGT1A1*28*28と肺癌リスクについて

UGT1A1*28*28と肺癌リスクについての解説記事 最新の研究で、UGT1A1*28*28と肺癌の罹患との関係が明らかになりました。この研究は2016年11月10日のInternational Journal of Clinical Oncology誌(オンライン版)に掲載されました。本稿は、今年読んだ一番好…

circular statistics (角度統計)について

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 以前読んだ論文。前回はWaveletについて述べた。今日は、角度統計(circular statistic…

疫学・統計・Rなどの役立つリンク集 (Useful Links for Epidemiology, Statistics, R etc)

統計学 Statistics 統計学の学習(Learning statistics) Basics of Statistics (Jarkko Isotalo) 統計解析結果のレポーティング(Reporting statistical results) JJCO誌のガイドラインは1997年と古い物だが、有用。 日本語:福田治彦、大橋靖雄「Japanese Jou…

羽鳥さんのR4DS

r4ds.had.co.nz データサイエンスとか、ビッグデータとか言った文言が流行っていますが、この際の作業の殆ど前処理です。 データサイエンティストの80%はマエショリストで出来ていると言っても過言ではありません。 世界でマエショリストを夢見るみんなへの…

WaveletCompを使って気象データの周期性を解析する

WaveletComp 以前読んだ論文を参考に、WaveletCompを使ってみた。 気象データ www.data.jma.go.jp ここからA村のデータをとってくる。 A村のデータ 5年間の気温、降水量、風速のデータを取得。以下で実装。 library(WaveletComp) w.temp <- analyze.wavelet(…

ワードで目次を作成する

プロトコル 研究プロトコルを作成するときに、目次を連動させたい。 プロトコルをワードで作成している。 TexではなくWord support.office.com 目次の作成(テキストの追加) | 初心者のためのOffice講座 基本は、それぞれの項目タイトル「見出し」に設定し…

QGISで日本地図を描く

GISに関するソフトウェア について、前回は、ArcGISというものを使ってみた。 QGIS QGISプロジェクトへようこそ! ここでインストールできる。 GDAL, python関係をインストールして、QGISを導入。 GDAL - Wikipedia 日本地図表示 QGISに地理院地図を追加する…

髄膜炎のGlobal Trendに関する時系列データ解析論文

髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 読んだ。 米プリンストン大学の研究者らからの報告。 髄膜炎の発症には、季節性があっ…

質的研究について

質的研究について Qualitative Research 質的研究の方法について、学んでみた。 数値で見るのが量的研究。 そうやって割り切れないものを見るのが質的研究。 調査する事象がどのように生起したか (how) を数値を使って説明する量的研究 (定量調査) とは異な…

標準化罹患比(SIR)と標準化死亡比(SMR)

SIRとSMR ある集団と、基準集団との疾病罹患・死亡の比較の指標について勉強してみた。 標準化罹患比 (SIR, Standardized Incidence Ratio) 人口構成の違いを除去して罹患率を比較するための指標。ある集団の罹患率が、基準となる集団と比べてどのくらい高い…

ソーシャルアントレプレナーシップについて

Entrepreneurship (アントレプレナーシップ) 少し文献を調べる機会があったので、忘れないうちに記述しておく。 アントレプレナーシップという単語は、1800年まで遡る。フランスの経済学者、Jean-Baptisteは以下のように述べた。 “The entrepreneur shifts e…

エビデンスレベルについての誤解がとけた

診療ガイドライン作成マニュアル 診療ガイドライン作成マニュアルを読んだ。 ガイドラインは、患者、医療者で意思決定を行う上で重要なツールである。 上記文献を読んだと同時に専門家に話を聞く機会があった。特にエビデンスレベルについて誤解していたので…

GIS再入門

岩波データサイエンス vol.4 読んでみた。 今回のテーマは、地理空間情報処理。再入門するには、基礎のところが良かった。あとは、個人情報保護の問題点まで、触れられていてよかった。雰囲気をつかむには良いと思われる。顧客データ等々の専門外のところは…

ggplot 2軸でプロットする

ggplot 美麗グラフが気に入っているのだが、そのままでは、左右で異なる軸を提示したいときにうまくいかない。 Rで解析:ggplot2の利便性が向上「plotflow」パッケージを参考にしたら、"plotflow"というパッケージを用いて二軸表示出来るようになった。 デー…