Yoshi Nishikawa Blog

医学となにかのインタラクティブ

マエショリスト

Rで表記ゆれを癒やす:全角から半角へ

日本語データを扱うときに困ること 日本語データを分析するときにもっとも困ることは何でしょうか? それは、表記ゆれです。 送り仮名、漢字かな混じり、全角半角混じり、大文字小文字混じり・・・色々ありますが、 今回は、特に、全角と半角が混ざった表記…

効率的なR運用を目指して

Rの基礎とプログラミング技法 Rの基礎とプログラミング技法に、Rを効率よく扱うコツについて非常にわかりやすく載っていたので、トライしてみた。 第5章:効率的なプログラミング apply applyは、 ベクトル単位で処理できる lapplyはリストやデータフレーム…

NAのある行を削除する

ある変数hogeの中に、NA(欠測値)があり、それを含む行だけを削除したい時。 data[complete.cases(data$hoge), ] でOK。