データサイエンス入門 目次
- はじめに(データサイエンスとは?参考資料などの準備)
- 数学と確率、データサイエンスの考え方
- 条件付き確率とベイズ定理(分割表、オッズ、オッズ比、薬の効果の推定、因果推定)
- ベイズ推定入門・機械学習(感染の推定(陽性的中率・陰性的中率)、薬の効果の推定、迷惑メールの推定等)
- 記述統計入門。R(EZR)を使った記述統計入門(データの要約、視覚化等)
- 離散確率分布(確率変数、確率分布、一様分布、二項分布)
- 二項分布(離散分布)と二項検定(p-value、アンケート結果の信頼性等)
- 二項分布の近似(ポアソン分布と正規分布)
- 連続確率分布と正規分布(含:微積分学の復習)
- 母集団と標本抽出、中心極限定理
- 統計的推定の仕組みとt検定(何故サンプルから全体が推定できるのか、何に注意すべきか)
- 母平均の推定と検定(Rを用いたシミュレーション。正解が分かっている問題で、統計解析を体験・練習)
- Rを用いた統計解析入門(実際の解析)(Rによる、母平均の母平均の区間推定・2群の母平均に差があるかどうかの検定等)
- 実際のデータ解析2(Rによる、分散の検定・分割表の検定・因果関係の推定・相関と線形回帰、疑似相関等)、学び続けるために..
- まとめと復習、期末試験予告
おまけ:ロジスティック回帰分析
(c) H. Kazama