Yoshi Nishikawa's Blog

データと知識、その調和平均。

これならわかる応用数学教室

読んだ。非常にわかりやすく記されていておすすめ。

  1. 最小二乗法
  2. 直行関数展開
  3. フーリエ解析
  4. 離散フーリエ解析
  5. 固有値問題と2次形式
  6. 主軸変換とその応用
  7. ウェーブレット解析

とにかく統計や計算機科学に関わる、(かつ、理解したい)人は、全員読んでおくと良いと思います。

tableone パッケージでtable1をつくる

臨床研究のtable1は

臨床系の研究で、図表を見ると、まず高確率で遭遇するtable1

http://medical.nikkeibp.co.jp/all/special/ebm/topics/200908/images/thumb_511983_0812-11.jpg

八割がたこういう患者背景だ。
(リンク先が「図」表記になっているッ・・・!)
これをいとも簡単に作成できるR packageがある。その名も・・・

tableone

table1 = 表1だ。 早速つかってみる。UCIのopen data “fertility"を用いる。

library(tableone)
res<-read.csv("http://archive.ics.uci.edu/ml/machine-learning-databases/00244/fertility_Diagnosis.txt", na.strings = "NA", as.is=T, header = F)
colnames(res) <- c("season", "age", "childish_diseases", "trauma", "surgery", "fever", "alcohol", "smoking", "sitting", "diagnosis")

#Create a variable list which we want in Table 1
listVars <- colnames(res)[-c(1)]

#Define categorical variables
catVars <- listVars[-which(listVars %in% c("age"))]

#Total Population
table1 <- CreateTableOne(vars = listVars, data = res, factorVars = catVars, strata = "diagnosis")
table1
summary(table1)

Table 1 (diagnosisでグループ分けしたもの)

f:id:yoshi_nishikawa:20170513155621p:plain

continuous variablesのサマリー

f:id:yoshi_nishikawa:20170513155631p:plain

categorical variablesのサマリー

f:id:yoshi_nishikawa:20170513155638p:plain

p値

f:id:yoshi_nishikawa:20170513155642p:plain

AGREEII~ガイドライン評価のためのガイドライン

equator network

The EQUATOR Network | Enhancing the QUAlity and Transparency Of Health Researchには、数々の論文執筆のためのガイドラインが載せられている。

AGREEII

ガイドライン評価にもAGREEII (Appraisal of Guidelines for Research&Evaluation II)というガイドラインが存在する。
AGREEIIの目的は以下だ。

1.ガイドラインの質を評価する
2.ガイドライン作成のための方法論的戦略を示す
3.ガイドライン上にどのような情報がどのように提供されるべきかを示す

The AGREE Reporting Checklist: a tool to improve reporting of clinical practice guidelines | The BMJ

AGREE II - AGREE Enterprise website

AGREEII 日本語訳

公共財はどのあたりが公共なのか

「今、僕は、とある山間部で仕事をしている。

朝、部屋で起きて、ご飯を食べて、コーヒーで一息入れる。

車にのり、道路を通って職場へと出かける。

或いは、公園の前を自転車で通って行っても良いかもしれない。

山の空気は澄んでいて、美味しい。」

あらゆるものを利用して生活しているが、この世のものは一体何が公共で公共でないのかを考えてみた。

公共財という言葉がある。

公共財 - Wikipedia

経済学の用語であり、非競合性あるいは非排除性の少なくとも一方を有する財として定義される。対語として、競合性と排除性とを有する私的財がある。

経済学において、ものごとの公共性については、「競合性」と「排除性」の二軸で考える。

競合性とは、利用者の消費が増えるにつれ、追加費用なしでは、次第に財の便益が保たれなくなる性質をいう。
ある一定数までであれば、利用者全員が問題なく便益を受けられるが、利用者が増えるに従って、混雑する。よって競合性が高い。

排除性とは、対価を支払わず財を消費しようとする者に対し排除的な性質を指す。

しかし、この中には中間領域が有る。公園か遊園地か。一般道路か有料道路か。 などだ。

この流れで、「非排除性」があるサービスについて、費用を支払わないで便益を享受する者をフリーライダーと呼ぶ。

フリーライダー - Wikipedia

話を戻そう。

  1. 朝起きる部屋、ごはん、コーヒー、車、これは、排除性も競合性も有する。私的財だ。
  2. 道路、これは、排除性はないが(通行料はいらない)、競合性がある(たくさん通ると混雑する)。公園も同じだ。コモンプール財という。
  3. 一方、先に出てきた、遊園地や高速道路、これらは、排除性を有する(お金がいる)。競合性は、場所によりそうだが、混んでいない、田舎の遊園地や高速道路をイメージするならば、競合性はないと言える。これをクラブ財という。
  4. 最後に、空気。これは、現時点では、際限なく誰でも吸うことが出来る。無償でだ。通常の状況では、100人居ようが1000人居ようが困ることはない。これを公共財と呼ぶ。

4に該当するものを純粋公共財とよび、非排除性または非競合性どちらかのみを持つ2 or 3を公共財と呼ぶ。

ggplot2で平均値の推移をプロットする

http://nfunao.web.fc2.com/files/sgplot_vs_ggplot2.pdf

http://nfunao.web.fc2.com/files/R-ggplot2.pdf

CRAN - Package doBy

このあたりが参考になる。

ちなみに、

package “gplot"には、plotmeansという便利関数がある。

Deep Learningことはじめ

読んだ。

これ一冊でDeep Lerningの理解は事足りる。とにかくわかりやすく記述されている。

1章 Python入門

1.1 Pythonとは
1.2 Pythonのインストー
1.3 Pythonインタプリタ
1.4 Pythonスクリプトファイル
1.5 NumPy
1.6 Matplotlib
1.7 まとめ

2章 パーセプトロン

2.1 パーセプトロンとは
2.2 単純な論理回路
2.3 パーセプトロンの実装
2.4 パーセプトロンの限界
2.5 多層パーセプトロン
2.6 NANDからコンピュータへ
2.7 まとめ

3章 ニューラルネットワーク

3.1 パーセプトロンからニューラルネットワーク
3.2 活性化関数
3.3 多次元配列の計算
3.4 3層ニューラルネットワークの実装
3.5 出力層の設計
3.6 手書き数字認識
3.7 まとめ

4章 ニューラルネットワークの学習

4.1 データから学習する
4.2 損失関数
4.3 数値微分
4.4 勾配
4.5 学習アルゴリズムの実装
4.6 まとめ

5章 誤差逆伝播

5.1 計算グラフ
5.2 連鎖率
5.3 逆伝播
5.4 単純なレイヤの実装
5.5 活性化関数レイヤの実装
5.6 A.ne/Softmaxレイヤの実装
5.7 誤差逆伝播法の実装
5.8 まとめ

6章 学習に関するテクニック

6.1 パラメータの更新
6.2 重みの初期値
6.3 Batch Normalization
6.4 正則化
6.5 ハイパーパラメータの検証
6.6 まとめ

7章 畳み込みニューラルネットワーク

7.1 全体の構造
7.2 畳み込み層
7.3 プーリング層
7.4 Convolution/Poolingレイヤの実装
7.5 CNNの実装
7.6 CNNの可視化
7.7 代表的なCNN
7.8 まとめ

8章 ディープラーニング

8.1 ネットワークをより深く
8.2 ディープラーニングの小歴史
8.3 ディープラーニングの高速化
8.4 ディープラーニングの実用例
8.5 ディープラーニングの未来
8.6 まとめ

査読に関して

staff.aist.go.jp

このサイトは役に立ちそうだ。