Yoshi Nishikawa's Blog

データと知識、その調和平均。

羽鳥さんのR4DS

r4ds.had.co.nz

データサイエンスとか、ビッグデータとか言った文言が流行っていますが、この際の作業の殆ど前処理です。 データサイエンティストの80%はマエショリストで出来ていると言っても過言ではありません。

世界でマエショリストを夢見るみんなへの手ほどきが、羽鳥さんのwebサイトで無償で公開されています。
英語版で本も発売される予定のようです。

このサイトは、ざっと眺めると、以下のような構成になっています。

  1. 全体のイントロダクション

I 探索する
2. イントロダクション
3. データ可視化
4. ワークフロー:基礎
5. データ変換
6. ワークフロー:スクリプト
7. 探索的なデータ解析
8. ワークフロー:プロジェクト

II データラングリング (おさまりの良いデータにする)
9. イントロダクション
10. tibblesを用いてデータフレーム作業
11. データインポート
12. データを整える
13. 関連データ
14. strings
15. 要素
16. 日付関連

III プログラム
17. イントロダクション
18. パイプ
19. 関数
20. ベクトル
21. イタレーション

IV モデル
22. イントロダクション
23. モデルの基礎
24. モデル構築
25. 色々なモデル

V コミュニケーションツール
26. 基礎
27. R マークダウン
28. コミュニケーションのためのグラフィック
29. Rマークダウンのフォーマット
30. Rマークダウンのワークフロー

意訳のところもありますが、全体を見渡すと、上記のようになっています。 マエショリストのいろはがわかります。興味があれば、本サイトへどうぞ。