Rで可視化する:可視化の方法とは
手持ちのデータを可視化する
データの特徴を示すためには、グラフや図にすることが重要である。 いくつも可視化があるのだが、実際にそれぞれのグラフを作成するには、
- データの性質を知る
- 可視化を実装する
- (実装の仕方を調べるために可視化の名称を知る)
が必要である。 Rでの可視化の実装について、以下のサイト(英語)にまとまっている。
データの性質
以下を押さえておくと良い。
- 連続変数
- カテゴリー変数
- 連続変数&カテゴリー変数
- 地図情報
- ネットワーク
- 時系列
可視化の実装
もちろんgoogle や書籍で調べるのだが、可視化方法の名称がわからないと調べ辛く、新たな手法に取り組む場合ここで躓く場合も多い。
可視化の名称
ここに具体例とともにまとまっている。
ワードに貼り付けた表の収まりがつかない
論文の表を、ワードに貼り付けて提出したい。医学論文ではよくあるシチュエーションです。
しかし、エクセルで作成した表は、横長の表になってしまって、ワードからはみ出て操作できない、そんな経験はありませんか?
それ、自動サイズ調整で、解決できます。
左上の十字矢印をクリックして表全体を選択して
表のレイアウト→自動サイズ調整をクリック
ウインドウサイズにあわせる
Rでcsvファイルを出力する
Rでcsvファイルに出力したい。
write.csv(hoge, file = "test.csv")
エクセルで開くことが出来るように、文字コードを指定する。
Microsoftコードページ932 - Wikipedia
write.csv(hoge, file = "test.csv", fileEncoding = "CP932")
Rの出力結果欄の表示幅を変えたい
tableoneを用いて、2群比較の結果をRで出力したのに、上段に1群、下段に1群の並びになってしまう。
これは、出力欄の表示列数が原因。
options(max.print="99999",width="300") #widthは出力結果欄の表示列数
これで解決。
2群比較は左右に並びます。
試料・情報の提供に関する記録の 作成・保管等について
情報の授受関係を記録するときの方法について、よくまとまった資料がありましたので覚書に残しておきます。
Bipartite Graph 2部グラフを描く
2部グラフを作成するため、type情報のTRUE/ FALSEを入力したい。
igraphのbipartite mappingを使うと良い。
g <- graph_from_data_frame(data, directed=TRUE) E(g)$weight <- data$N #重みづけ V(g)$type <- bipartite.mapping(g)$type #type情報を入れる
igraphを使って、データフレームから隣接行列を得る
column1=起点のnode、clumn2=終点のnode、column3=重み、のようなデータフレームがあって、隣接行列を得た。
まず、igraphデータに変換する。
g <- graph_from_data_frame(data, directed=TRUE) E(g)$weight <- data$data[,3] #重み
以下で隣接行列を取り出せる。
g_ad <- get.adjacency(g, sparse=FALSE, attr = "weight")