2016-01-01から1年間の記事一覧
シェープファイル(Shapefile)とは シェープファイル(Shapefile)とは、Esri 社の提唱したベクトル形式の業界標準フォーマットです。Esri 製品はもちろん、多くの GIS ソフトウェアで利用が可能です。シェープファイルは仕様が公開されています。シェープフ…
ブートキャンプのウィンドウズでスクリーンショット Windowsをブートキャンプで起動することがあります。 私の場合、ArcGISを使う場合がほとんどです。 以下のサイトを参考にしました。 www.webantena.net 主に3つの方法があります。 osk (スクリーンキーボ…
UGT1A1*28*28と肺癌リスクについての解説記事 最新の研究で、UGT1A1*28*28と肺癌の罹患との関係が明らかになりました。この研究は2016年11月10日のInternational Journal of Clinical Oncology誌(オンライン版)に掲載されました。本稿は、今年読んだ一番好…
髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 以前読んだ論文。前回はWaveletについて述べた。今日は、角度統計(circular statistic…
統計学 Statistics 統計学の学習(Learning statistics) Basics of Statistics (Jarkko Isotalo) 統計解析結果のレポーティング(Reporting statistical results) JJCO誌のガイドラインは1997年と古い物だが、有用。 日本語:福田治彦、大橋靖雄「Japanese Jou…
r4ds.had.co.nz データサイエンスとか、ビッグデータとか言った文言が流行っていますが、この際の作業の殆ど前処理です。 データサイエンティストの80%はマエショリストで出来ていると言っても過言ではありません。 世界でマエショリストを夢見るみんなへの…
WaveletComp 以前読んだ論文を参考に、WaveletCompを使ってみた。 気象データ www.data.jma.go.jp ここからA村のデータをとってくる。 A村のデータ 5年間の気温、降水量、風速のデータを取得。以下で実装。 library(WaveletComp) w.temp <- analyze.wavelet(…
プロトコル 研究プロトコルを作成するときに、目次を連動させたい。 プロトコルをワードで作成している。 TexではなくWord support.office.com 目次の作成(テキストの追加) | 初心者のためのOffice講座 基本は、それぞれの項目タイトル「見出し」に設定し…
GISに関するソフトウェア について、前回は、ArcGISというものを使ってみた。 QGIS QGISプロジェクトへようこそ! ここでインストールできる。 GDAL, python関係をインストールして、QGISを導入。 GDAL - Wikipedia 日本地図表示 QGISに地理院地図を追加する…
髄膜炎に関する論文 Seasonal dynamics of bacterial meningitis: a time-series analysis. The Lancet Global Health http://dx.doi.org/10.1016/S2214-109X(16)30064-X 読んだ。 米プリンストン大学の研究者らからの報告。 髄膜炎の発症には、季節性があっ…
質的研究について Qualitative Research 質的研究の方法について、学んでみた。 数値で見るのが量的研究。 そうやって割り切れないものを見るのが質的研究。 調査する事象がどのように生起したか (how) を数値を使って説明する量的研究 (定量調査) とは異な…
SIRとSMR ある集団と、基準集団との疾病罹患・死亡の比較の指標について勉強してみた。 標準化罹患比 (SIR, Standardized Incidence Ratio) 人口構成の違いを除去して罹患率を比較するための指標。ある集団の罹患率が、基準となる集団と比べてどのくらい高い…
Entrepreneurship (アントレプレナーシップ) 少し文献を調べる機会があったので、忘れないうちに記述しておく。 アントレプレナーシップという単語は、1800年まで遡る。フランスの経済学者、Jean-Baptisteは以下のように述べた。 “The entrepreneur shifts e…
診療ガイドライン作成マニュアル 診療ガイドライン作成マニュアルを読んだ。 ガイドラインは、患者、医療者で意思決定を行う上で重要なツールである。 上記文献を読んだと同時に専門家に話を聞く機会があった。特にエビデンスレベルについて誤解していたので…
岩波データサイエンス vol.4 読んでみた。 今回のテーマは、地理空間情報処理。再入門するには、基礎のところが良かった。あとは、個人情報保護の問題点まで、触れられていてよかった。雰囲気をつかむには良いと思われる。顧客データ等々の専門外のところは…
ggplot 美麗グラフが気に入っているのだが、そのままでは、左右で異なる軸を提示したいときにうまくいかない。 Rで解析:ggplot2の利便性が向上「plotflow」パッケージを参考にしたら、"plotflow"というパッケージを用いて二軸表示出来るようになった。 デー…
データクリーニング データから、知識を入れて、情報を作る際には、以下のようなプロセスがある(と認識している)。 1データ収集→2データクリーニング→3解析・モデリング このプロセスにより、生データ→クリーニングされたデータ→解析用データ→結果、となる。…
ggplot2 2016年に出版されたggplot2に関するHadley Wickhamによる著書。その名もggplot2、の続き。 コンテンツ 大きく分けて3部で構成され、全12章にわかれている。今回は第2回。 Part2 文法 4 文法 文法が大切である。 5 レイヤー データ、aes、stat、geom…
ggplot2 2016年に出版されたggplot2に関するHadley Wickhamによる著書。その名もggplot2。読んでみた。 コンテンツ 大きく分けて3部で構成され、全12章にわかれている。 Part1 はじめる 1 イントロダクション 自身のGitHubなどが紹介されている。 いつもどお…
モンテカルロ積分 Monte Carlo integrationは、random samplingに基づく統計手法である。 いつも通り公開コードを少しずつ改変しながら進める。 \begin{eqnarray} \theta = \int_m^{M} {e}^{-x}dx \end{eqnarray} n <- 10000 m<-3 ; M<-6 x <- runif(n, min=…
EZRを卒業する EZRが、初学者にとても有用なツールであることは記した。 そして、多くのEZRユーザーは、起動時にEZRが起動するよう設定する。しかし、Rも十分に使えるようになってくると、逆にR起動時に、R コマンダー、EZRが開かれてしまうのは、何かと不便…
Rによる計算機統計学 Rによる計算機統計学を読んでいる。 英語の原書はこちら。 多変量の見せ方 の続き。lattice packageを用いて、3D scatterplotを作る。irisデータを用いる。 公開されているコードから少し改変してトライ。 3D scatterplot library(latti…
Rによる計算機統計学 Rによる計算機統計学を読んでいる。 英語の原書はこちら。 Rコードの例:R code examples 多変量の見せ方 データを分析するにあたり、統計手法は勿論大切なのだが、モデルを作るとき等の変数選択には、大きく分けて2通りのアプローチが…
Rによる計算機統計学 Rによる計算機統計学を読み始めた。 英語の原書はこちら。 Rコードの例:R code examples この本の特徴は、文献を豊富に引用しており、学習に拡がりをもたせることが出来る。 ただ、Rを最低限扱える人でないと厳しいと思う。 逆変換 乱…
Hadley Wickhamアニキ 各所でR神と崇められているHadley Wickham(ハドリーウィッカム)アニキの存在を、つい最近知った。 そのきっかけは、使っているpackageが気づいたらHadley Wickhamアニキのものばかりだった。しかもdplyr, ggplot2など、欠かせないもの…
Rを愛している Rは、フリーソフトで、可能な計算は多岐にわたる。 他の統計ソフトも用いてみたが、 1. パッケージの多様性 2. 関連書物・文献の増加 3. 無料であること という絶大なメリットが有る。 逆に、唯一デメリットといえるのが、コードの習得だ。私…
数学いらずの医科統計学 数学いらずの医科統計学 を読み解いている。 今日は 12章, 14章について。 CI of the mean (平均値のCI) (Latexを使って以下、書いてみた。) 平均値のCIは、4つの値、サンプル平均、標準偏差、サンプルサイズ、信頼度により計算され…
数学いらずの医科統計学 数学いらずの医科統計学 を読み解いている。 今日は 10章「ガウス分布」について。 この名前、恥ずかしながら初めて知ったが、いわゆる正規分布のことらしい。 Key words Gaussian distribution; norm distribution: KarL Gaussが180…
数学いらずの医科統計学 数学いらずの医科統計学 を読み解いている。 今日は9章「散らばり」について。 「平均的な人間は1つの乳房と1つの精巣を備える。」 ーーーー統計学者 Des McHale 巻頭言から吹き出した。最高である。そして、「平均的な」議論だけ…
Keywords 「はじめての統計データ分析」 を読み解いています。 キーワードを列挙し、まとめていきます。 1章 2章 EAP (expected a posteriori) MED (posterior median) MAP (maximum a posteriori) 3章 4章 5章 6章